第742章 文字的特徵
語言,並沒有多麼神秘,其實就是智慧生命用來交流的方式。
任何的交流方式,都需要介質。
人類用聲音交流的介質是空氣。
因此,正常情況下,存在大氣的行星上,如果蘊育出了生命,那麼這些生命也會漸漸進化出用聲音交流的能力。
每一種交流方式,都和生物的身體感官有關。
人類除了可以用聲音交流之外,還可以使用肢體語言,而肢體語言使用的感官器官是眼睛,通過視覺傳遞信息。
如果一種生物,進化出了發射電磁波的器官,那麼也將出現更加快速的交流方式。
無論使用什麼方式進行交流,只要想把信息記錄下來,那就必然會產生文字。
軍科院的電子信息部門,用了三天的時間,把隕石微生物基因里記錄的所有信息都找了出來,並給出了一份更詳細的報告。
「從鹼基編碼分析來看,隕石文明留下的信息,應該是以文字作為載體……「
魯修文一邊看著分析報告,一邊向軍事科研班的學員講解:「隕石文明在微生物基因編碼里留下的文字,大概有兩萬個字,或是詞。
「其中不重複的獨立單字或單詞,超過2000個。從這個特徵來看,隕石文明的文字,重複率並不高,不屬於英語類的字母文字。」
「怎麼看出來不是字母文字的?」牛大志好奇的追問。
「這還不簡單嗎?如果是字母,就只有26個,怎麼出現2000個不重複的單字?就算隕石文明的字母特別多,有100個字母,那也就是100個獨立不重複的字母,不會是2000個。除非這文明腦子有坑,弄出來2000個字母。」伊芙攤手解釋道。
「好,沒有英語太棒了。」牛大志立時鼓掌叫好。
伊芙捂著額頭,露出一副已經沒法拯救的表情。
「如果是2000個字母,以這種龐大的字母庫,單個字母應該會有單獨的意義,這其實已經和單字沒有區別。英語之所以單個字母不具備含義,就是因為字母庫太小,需要多個字母才能表達含義。」魯修文補充一句。
在場的除了生物研究院的教授之外,還有幾位宇宙社會學的教授。
在外星文明的研究上,郎同光是更專業的。
他取出一份資料,發給面前的幾人,講解道:「其實,在拿到軍科院對隕石文明留下信息的分析報告之後,我和幾位同事立即做了文字對比。
「這份就是我們用幾份漢字論文做的單字統計,由於隕石文明信息分析中顯示,總共有兩萬字。
「所以,我們挑了幾篇兩萬字左右的論文做統計,結果就是,論文中獨立不重複的單字,數量在1000個到1400個之間。
「英文的論文就暫時不考慮的,不重複的獨立字母只有26個,加上阿拉伯數字數字是36個,沒有參考價值。
「我們做的漢字文獻單字統計,做了一百多份,結果都在1000個到1400個之間,平均下來是1200個單字。
「樣本是足夠的,所以基本可以確定,以漢字撰寫的文獻,在2萬字篇幅下,不重複的獨立單字平均1200個。
「這和隕石文明的2000個不重複獨立單字,有一些差距。不過差距不到兩倍,這個差距在外星文字的研究上,其實並不大。
「因此,從出現的獨立單字數量來看,隕石文明所使用的文字,和漢字有相似的特徵。
「可以初步確定,隕石文明的文字庫,應該比漢字大,他們常用的文字數量也比漢字多。
「根據這些文字特徵,進行破譯,會簡單很多。」
方源思索片刻後問道:「要多久才能破譯出這些信息的含義?」
「這個還無法確定,由於沒有一個基礎點,要用窮舉法進行破譯,難度很大。而且,更困難的是,即便是窮舉法,也沒有一個標準答案,即便破譯出了結果,也無法確定破譯的結果是否正確,這才是最困難的地方。」郎同光解釋道。
「沒有更好的辦法了嗎?」方源覺得軍科院的技術手段,應該不至於此。
「辦法當然是有的,可以通過猜測,先確定一部分文字……」
郎同光接著解釋:「比如,通過分析,我們已經基本可以確定,隕石文明是所有的文字,和漢字有很多特徵相似。
「那麼,我們就可以更進一步猜測。隕石文明所留的文獻裡面,重複最多的字代表什麼含義?
「比如漢字文獻裡面,重複最多的字,一般是『的』字,第二的是『是』字。
「那麼,我們就可以繼續猜測,隕石文明的文字裡面,是不是也有『的』這樣的字。
「如果有,重複最多的那個字,是不是就是『的』,或者是含義相近的字。
「當然這只是猜測,因為漢語中的『的』是個助詞,本身沒有含義。
「我們還不能確定隕石文明的語言中,也有這樣的無意義助詞。
「所以,這個猜測的過程需要進行驗證,才能確定是否正確。」
魯修文接過話頭道:「確實,對於外星文字的研究,難度確實比較大。它還不像甲骨文,甲骨文還能通過文字的形狀猜測其含義。
「現在擺在我們面前的是一串沒有含義的編碼,要通過編碼的特徵猜測文字的含義,難度確實大。」
方源一邊思考一邊點頭道:「確實,不過,也可以先猜測一下隕石文明有可能留下什麼信息,再和進行編碼破譯。
「比如,隕石文明在毀滅時,最想要留下的信息,開篇應該先介紹他們的文明。然後應該還會講述文明滅亡的原因,是被高等文明毀滅的?還是在宇宙天災中毀滅的。
「先對信息的內容進行推測,再進行文字破譯,應該會容易一些吧?」
郎同光點頭贊同道:「這個思路是對的,不過還是需要超級計算機來進行破譯,人類的大腦優勢是想像力,但在計算力上,還是計算機更有優勢。」
「應該不用太長時間,一兩個星期,應該就能得出結果。」魯修文說道。
(本章完)