王正陽陪著秦毅往研究所內走去,聊到漢語作業系統、漢語編程相關的內容,他的眉毛都皺成了川字。
「漢語作業系統和漢語編程雖然是一個老話題了,以前也有很多前輩在研究這個東西,但是一直以來我們都沒有任何的進展,你也不要太過著急,仔細的理清楚思路,辦法總比困難多。」
秦毅笑著安慰。
漢語編程和漢語作業系統並不是什麼新鮮的東西,從計算機傳到我們國內開始,我們國家就有人去研究這個漢語作業系統和漢語編程。
原因很簡單,因為漢語是我們的母語,我們日常生活也好,工作往來也好全部都是使用漢語,而計算機領域內的東西幾乎都和英語有關,基礎和框架都是建立在英語的基礎上。
這對於我們國家的計算機技術和網際網路產業的發展都非常不利,如果能夠使用漢語去編程、構造漢語操作的話,對於我們國家計算機和網際網路產業的發展都非常有幫助。
不過,漢語編程和漢語作業系統的研究可謂是坎坷無比,異常的艱辛。
從早開始的時候,僅僅只是為了研究一個漢語輸入法,國家這邊就召集了很多研究人員、科學家去仔細的研究。
因為漢語和英語是完全兩個不同的語種,彼此之間的差別實在是太大了。
漢語屬於漢藏語序的文字,是從最早的象形文字衍變而來;英語則是屬於印歐語序,由26個源於拉丁字母的字母組成。
因為兩種語言的巨大差異,在計算機和網際網路剛剛傳播到我們國內的時候,我們往計算機內輸入漢字非常的慢,還必須依靠拼音字母來輸入漢字。
後來經過科學家和研究人員的辛苦研究,發明了五筆輸入法,漢字輸入速度瞬間飆升,再後來,隨著研究輸入法的人越來越多,各種各樣的智能輸入法相繼出現,漢語輸入的問題得到了很好的解決。
但是在漢語編程和漢語作業系統上面的研究,一直以來都沒有任何實質性的突破,目前全球主流和使用最廣的編程軟體全部都是英文軟體。
至於作業系統,那更是英語的天下,不管是微軟的Windows系統還是蘋果公司的系統,那也都是基於英語基礎上的作業系統。
投入很多,研究這方面的人也很多,卻是始終沒有什麼實質性的突破,以至於有些人甚至將責任怪到漢語的頭上。
認為漢語是劣等語言,無法適應時代潮流的發展,國家應該全面淘汰漢語,學習印度將官方語言改為英語,這樣才能夠更好的和世界接軌,趕上時代潮流的發展。
當然關於這種故意貶低自己,抬高別人的荒謬說法最後都不攻自破,隨著智慧型手機的出現,大家陡然就發現,在手機上面輸入信息,漢語用九個字母鍵就足夠了,速度非常快,但是英語的輸入就非常慢,而且極容易出現錯誤。
以至於英語輸入的時候,大家竟然漸漸地有向漢語學習的趨勢,使用更加簡潔的方式來表達意思。
「我也不怎麼急,只是一直以來沒有什麼進展,整個人都非常煩躁。」
聽到秦毅安慰的話,王正陽微微苦笑。
能夠進入星河科技研究院,他的工資待遇非常不錯,富足的小康生活是完全沒有任何的問題,生活上沒有什麼煩惱的事情。
可是這工作上面,研究這漢語編程和漢語作業系統,長期沒有什麼進展之下,整個人都變的非常的煩躁,一度甚至都想要辭職不幹了。
「跟我說說,這漢語編程和漢語作業系統方面到底有那些問題?」
秦毅笑了笑,其實漢語編程和漢語作業系統的研究方面,秦毅多少也是知道一些的,並且自己也是去認真的學習和研究過。
在科技塔之中,秦毅也是仔細的研究了宇宙之中諸多文明的語言和文字,找到了很多和漢語差不多的語言,仔細的研究他們的計算機作業系統和編程系統。
而科技塔作為高級文明的作品,對於不懂語言和文字之間的系統、編程之類的也是有詳細的說明,各種各樣的文字該如何去出發,如何去理清思路都有一個指引。
這一次過來,秦毅也是打算將這些思路和方法傳授給大家,不然,等虛擬機都研究出來了,這漢語作業系統和漢語編程系統都未必已經研究出來。
「從哪裡說起好呢~」
王正陽帶著秦毅來到了研究所裡面,來到一間會議室當中,會議室裡面坐滿了研究所的研究漢語編程和漢語作業系統的人。
王正陽仔細的整理了一番自己的語言,想了想說道:「先從語言說起吧,漢語相比起英語來,有很多優勢。」
「漢語文字精煉,言簡意賅,冗餘度低,以最少的符號表達最豐富的含義,我們從信息學的角度予以闡述,漢字、西文字母作為語言文字的最基本單位,用以構成詞彙、句子,傳達一定的信息,是信息的載體,如何對每一個漢字、字母所負載的信息進行度量?」
「現代信息學用熵來衡量平均信息量,熵表示指定符號出現的不肯定性。西文字母採用的拼音文字字母有30個左右,漢語以方塊字為書寫單位,數目成千上萬,顯然其隨機出現的不肯定程度比西文字母的不肯定程度要大得多,從這一角度講每個漢字載荷的信息量遠遠大於一個字母的信息載荷量。」
「我們經過統計計算,得出法語字母的零階熵值為98比特,義大利字母零階熵值為00比特,西班牙字母零階熵值為01比特,英語字母的零階熵值為03比特,德語10比特,羅馬尼亞語為12比特,俄語為35比特。」
「英語詞的零階熵為0比特,漢語詞的零階熵為46 比特,這表明漢語的詞義也比英語豐富。」
王正陽一邊說,旁邊有人開始打開投影儀,播放出他們對漢語和英語差異方面的研究成果。
「因為我們的漢語太過言簡意賅,一個字、一個詞表達的意思太豐富了,同樣的一個字一個詞在不同的場合下,語氣下,意思就完全不一樣。」
「因而由漢字組成的句,它的意思就更加的豐富,往往非常簡單的一句話,它卻是擁有多個意思。」
「比如能穿多少是多少?」
「這一句非常簡答的話,它就有兩種意思,一種是儘可能的多穿衣服,一種是儘可能的少穿衣服,兩種意思完全不同,可是偏偏又是同樣的一句話。」
「本來語言精簡是非常不錯的一件事情,但是在計算機領域內,因為計算機從根本上來說,它是一種精準的計算。」
「意思表達不明確,它就根本沒有辦法去計算。」
「相反英語就比較冗長,但是冗長歸冗長,冗長度高的語言結構性好,語言信息表達精確,糾錯能力強,利於計算機的計算、編程等等。」
秦毅仔細的聽著,王正陽講的這些東西一聽就懂,對於計算機也深入學習過的秦毅自然就明白。
「據我所知,程序編碼的過程當中是儘可能的要求精煉,按理來說我們漢語的優勢應該是更明顯才對。」
聽到這裡,秦毅想了想提出了自己的疑惑。
「你說的不錯,從計算機發展的歷程來說,編程方面一直都要求精煉,特別是在計算機剛剛發展起步的時候,因為存儲容量有限,編碼都是儘可能的精煉。」
「這就好比是我們古代,在還沒有發明紙張之前,書寫僅僅只能夠在羊皮、竹子上面的時候,因為書寫材料製作不已,所以書寫的時候都儘可能的簡練,於是有了我們現在的文言文。」
「但是精煉歸精煉,計算機說到底還是一種運算,一種計算方式,精煉也要表達出準確的意思才行,我們漢語意思太豐富,精煉是絕對夠,但表達的意思太過豐富,它對於計算就帶來了巨大的困擾。」
聽到秦毅的話,王正陽點點頭,他是計算機文字信息處理方面的專家,對這些東西都很懂。
「那這樣說來,漢語編程和漢語系統是不可能實現了?」
聽到這裡,秦毅忍不住皺起了眉頭,聽這王正陽的話,總覺得讓人比較鬱悶外加氣憤,心裏面都考慮著要不要換過一個人過來主持這個工作。
這還是秦毅第一次動了換人的年代,一直以來秦毅都沒有換過任何一個研究單位的負責人,但是這次,秦毅真的有點動了這個年代了。
「不~這英語可以實現,我們漢語也可以實現。」
「因為我們的漢語表達的意思更加的豐富,我認為在未來計算機發展的歷程當中,我們漢語的優勢會越來越明顯。」
「另外,計算機是計算機,語言是語言,這英語可以,我們漢語也可以,其它的日語、阿拉伯語等等也都可以,本質上來說任何一種語言都是可以的。」
「只是我們可能是因為受到了英語的限制,受到了現有編程思維限制,一直無法打破英語編程和英語作業系統留下的條條框框,所以我們一直沒有什麼進展。」
PS:有沒有學計算機的,都出來說說漢語編程的可能性~