第7章 七(1 / 2)

旋給我打電話的時候,我依然是在圖書館。她在手機那頭語氣激動的告訴我,有突破了,有突破了,還不是一般的突破。

我一摁掉手機就飛一樣的奔出圖書館,奔出學校,買上火車票去北京。

一個多小時的火車,我卻坐的得不安心極。火車到路旁鬱鬱蔥蔥的綠樹稻田在夕陽的折射下葉子反射出寶石般的光澤,我想看清,但那暗幽幽的光澤一閃而過,根本不等我。

我想找個句子形容我的感受,可是怎麼也形容不出。

到了北京已經是傍晚。匆匆趕到旋的學校時太陽則完全落山。旋問我要不要吃晚飯,我心急如焚,連說,不用不用,快跟我說說怎麼突破。

同學把我帶到實驗室,她扭開實驗室大門,打開燈,我卻被滿屋子的電腦設備嚇了一大跳。我一邊看著同學打開一台由十數台電腦組成的大型電腦,一個一邊不解的問:“你們不是學中文麼?怎麼改計算機了?”

“馬上你就知道了。”同學滿有把握。

看著同學在電腦上操作幾下,液晶顯示器上隨即彈出一個看起來非常粗製濫造的界麵,也沒有寫任何標題。我把頭湊過去,聽同學介紹。

一刻鍾後我終於搞懂這是一個用計算風格學來論證作者是誰的程序。概言之,對於某一個特定的人來說,他的語體風格就是個人言語特征,是人格在語言文字活動中的某種體現。這種風格可以在一定程序上通過數量特征來刻畫。

例如,句長和詞長可以代表作者造詞句的風格;字、詞在作品中出現的頻率也是個人風格的體現。利用計算機計算一部作品或某一位作者平均詞長和平均句長,對作品或作者使用的字、詞、句的頻率進行統計研究,從而了解作者的風格,這被稱之為計算風格學。這對鑒別作品是否偽造有決定性的作用。而我同學所在的學校就是國內在這個研究領域的先驅。

我恍然大悟,續而問:“那麼,準確度有多高?”

旋調試著軟件,解釋說:“這個軟件剛做完不幾天,還沒有進行最後的調試。但是,進行我們的測試,如果輸入字數在一萬字以上,能夠達到百分之八十的準確度。輸入字數越多,準確程度也越高,差不多是呈指數增加。”

“如果對京洛世人的詩歌進行鑒別呢?”

旋看著我,指了指屏幕讓我看,“如果是對他的所有詩歌進行鑒別,那可能達到百分之六十五的確認程度。”

我看著屏幕上細細的曲線和複雜的數據,吃一驚:“這個比例無論如何也不算高。”

“不,已經算得上高了。”

“怎麼講。”

“你知道,就算把李白的所有詩歌輸入電腦,電腦認為是同一個人寫的概率也隻有百分之七十。”