同樣是在20世紀60年代,美國的莫索·泰勒和華萊士用“標示詞”統計學和以詞頻率綜合比較的辦法,解決了第二樁文學公案:綜合漢密爾頓和麥迪遜二人各種用詞的寫作習慣,最後判定這12篇的作者是詹姆斯·麥迪遜。
延伸閱讀
莎士比亞是文藝複興時期最偉大的人文主義作家,以創作38部劇本的輝煌成就雄踞世界戲劇史之巔。可是,有關莎士比亞,一位來自鄉下的普通工人,是否能寫出如此驚世之作的爭論在19世紀中葉達到白熱化。這些懷疑莎士比亞能力的人認為是另一位受過教育的人,如牛津伯爵,愛德華·德衛爾寫的這些劇本。可是,為何伯爵要把這些劇本署名莎士比亞呢?有些人聲稱,這是為了嫁禍於人,讓大家去批評莎士比亞。
近年來,由美國馬塞諸塞州大學馬塞諸塞州文藝複興研究中心的主任亞瑟·肯萊領導的一個研究小組用“電腦指紋”(電腦指紋是由已知著作創建的,再用來比較不知名作品的指紋,看是否能匹配)分析了莎士比亞的文學作品,驅散了人們的這一疑惑。
為鑒別莎士比亞作品的真偽,亞瑟·肯萊肯萊領導的研究小組首先建立了龐大的數據庫,裏麵有好幾十萬字的莎士比亞作品和他同時代的其他劇作家的作品。然後,他們用一種叫電腦文體論的方法來分析其中的文字的用法、出現頻率、短語的拚寫與放置位置,還有通用和稀用單詞。比如,“gentle”一詞在莎士比亞作品中出現的頻率幾乎是其他作者所著作品的2倍。而且,莎士比亞戲劇中頻繁發現在“hail”前加上“farewell”。
計算機通過大量的統計分析確認,莎士比亞確實是這些作品唯一的作者。
《紅樓夢》是曹雪芹一個人寫的嗎
情境導入
眾所周知,《紅樓夢》是我國的四大名著之一。自其誕生之時,就一直引來各方關注。而它的前80回與後40回是否出自曹雪芹和高鶚之手,一直是紅學研究一個重要而又沒有得到定論的問題。如今,數學方法的應用又為這個問題的解決提供了科學可靠的依據。
數學原理
1954年,瑞典漢學家高本漢考察了38個字在《紅樓夢》前80回和後40回出現的情況,認為前後作者為一人。
我國學者趙岡、陳鍾毅夫婦用“了”、“的”、“若”、“在”、“兒”5個字出現的頻率分別作均值的t檢驗,認為前80回和後40回明顯不同。
1981年,美國威斯康星大學講師陳炳藻用計算機對《紅樓夢》進行了研究,他把曹雪芹慣用句式、常用詞語以及搭配方式等,作為樣本存儲到電子計算機裏,作為檢驗的依據。然後對《紅樓夢》前80回和後40回進行比較鑒別,結果發現兩者之間的正相關達80%。因此他得出結論,認為120回均係曹雪芹所作。
同樣是在20世紀60年代,美國的莫索·泰勒和華萊士用“標示詞”統計學和以詞頻率綜合比較的辦法,解決了第二樁文學公案:綜合漢密爾頓和麥迪遜二人各種用詞的寫作習慣,最後判定這12篇的作者是詹姆斯·麥迪遜。
延伸閱讀
莎士比亞是文藝複興時期最偉大的人文主義作家,以創作38部劇本的輝煌成就雄踞世界戲劇史之巔。可是,有關莎士比亞,一位來自鄉下的普通工人,是否能寫出如此驚世之作的爭論在19世紀中葉達到白熱化。這些懷疑莎士比亞能力的人認為是另一位受過教育的人,如牛津伯爵,愛德華·德衛爾寫的這些劇本。可是,為何伯爵要把這些劇本署名莎士比亞呢?有些人聲稱,這是為了嫁禍於人,讓大家去批評莎士比亞。
近年來,由美國馬塞諸塞州大學馬塞諸塞州文藝複興研究中心的主任亞瑟·肯萊領導的一個研究小組用“電腦指紋”(電腦指紋是由已知著作創建的,再用來比較不知名作品的指紋,看是否能匹配)分析了莎士比亞的文學作品,驅散了人們的這一疑惑。
為鑒別莎士比亞作品的真偽,亞瑟·肯萊肯萊領導的研究小組首先建立了龐大的數據庫,裏麵有好幾十萬字的莎士比亞作品和他同時代的其他劇作家的作品。然後,他們用一種叫電腦文體論的方法來分析其中的文字的用法、出現頻率、短語的拚寫與放置位置,還有通用和稀用單詞。比如,“gentle”一詞在莎士比亞作品中出現的頻率幾乎是其他作者所著作品的2倍。而且,莎士比亞戲劇中頻繁發現在“hail”前加上“farewell”。
計算機通過大量的統計分析確認,莎士比亞確實是這些作品唯一的作者。
《紅樓夢》是曹雪芹一個人寫的嗎
情境導入
眾所周知,《紅樓夢》是我國的四大名著之一。自其誕生之時,就一直引來各方關注。而它的前80回與後40回是否出自曹雪芹和高鶚之手,一直是紅學研究一個重要而又沒有得到定論的問題。如今,數學方法的應用又為這個問題的解決提供了科學可靠的依據。
數學原理
1954年,瑞典漢學家高本漢考察了38個字在《紅樓夢》前80回和後40回出現的情況,認為前後作者為一人。
我國學者趙岡、陳鍾毅夫婦用“了”、“的”、“若”、“在”、“兒”5個字出現的頻率分別作均值的t檢驗,認為前80回和後40回明顯不同。
1981年,美國威斯康星大學講師陳炳藻用計算機對《紅樓夢》進行了研究,他把曹雪芹慣用句式、常用詞語以及搭配方式等,作為樣本存儲到電子計算機裏,作為檢驗的依據。然後對《紅樓夢》前80回和後40回進行比較鑒別,結果發現兩者之間的正相關達80%。因此他得出結論,認為120回均係曹雪芹所作。