正文 第49章 思考,然後堅持(2 / 2)

在這樣的環境裏,李開複學會了通過自學和請教他人積累專業知識,學會了主動與同學探討、切磋。在這樣一來一往的過程中,不知不覺地,李開複學會了如何堅持自己的觀點,而不是人雲亦雲。

在為李開複選定博士論文課題之後不久,瑞迪教授給李開複製定了一個長遠的研究計劃,還告訴他不用擔心研究經費的問題。而瑞迪教授給予李開複的支持遠不止這些。

一開始李開複用一種叫“人工智能”的方法來進行語音識別係統的研究。這種方法為所有專家所信奉,所以又稱“專家係統”,其要旨是用機器來模擬人的語言能力,就像是教給一個嬰兒識別“爸爸”、“媽媽”的含義,再讓他學會說出口來,這樣的過程很像是一個嬰兒在學習語言,區別隻在於這個“嬰兒”是一台機器。專家們以20個人的聲音反複訓練,結果發現這個“嬰兒”居然能聽懂也能說出話來,就像是一個真的嬰兒在講話。

這一成果轟動全美,人們把它作為一個重大發明,瑞迪教授信心十足地計劃著在這條道路上繼續走下去,當時李開複也跟著寫了一篇文字優美、結論精致的論文,說語音識別率已經達到95%。但他很快就發現,“專家係統”其實沒有用。道理很簡單,嬰兒能夠長大成人,機器卻不能。當李開複用另外100人的聲音重新檢驗原來20種聲音的實驗成果時,立刻發現這機器不靈了。

做了一年以後,李開複覺得用瑞迪教授的方法可能無法延續下去。他認為,對於“不特定語者”的研究來說,20個人的語音數據庫太小,所產生的結果,無論多麼精彩也沒有意義,要解決這個問題需要建立一個大的數據庫,而大數據庫則必然需要統計的方法而不是原來的“專家係統”。

於是有一天,李開複大膽地走到了瑞迪教授的辦公室裏,告訴瑞迪教授,自己不希望再用專家係統方法做下去了,而是希望用統計的方法來做語音識別。瑞迪教授問了李開複幾個問題,為什麼認為統計可以,而專家係統不可以。之後他思考了一段時間,看得出來,瑞迪教授並不同意李開複的看法。然而,他並沒有馬上下結論,他說:“你對人工智能沒有興趣,我不同意你的看法,但我可以支持你用統計的方法。不過,我提醒你,過去有人用統計方法做過類似的工作,都沒有成功。”麵對導師的提醒,李開複再度試圖說服教授:過去的研究者沒有取得成功,那是因為他們的語料數據不足。聽到李開複的解釋,瑞迪教授給了他很大的支持:“你喜歡大語料,我可以去找國防部,讓他們出錢建立一個很大的語料庫。”

雖然在瑞迪教授的支持下,大語料庫真的建起來了,但李開複在這方麵的進展甚微,周圍的人根本不同意他的方法,隻有一位正在國際商用機器公司做論文的師兄例外。他非常讚賞李開複的想法,還很慷慨地把自己在統計方麵的知識和經驗傾囊相授。這位師兄就是後來大名鼎鼎的許峰雄,1997年,以他為研究小組組長的超級電腦“深藍”戰勝了國際象棋世界冠軍卡斯帕羅夫,震驚了全世界。

從專家係統轉到統計的方法,李開複遇到了很多困難。由於李開複采用了一種全新的方法來做語音識別,在這條路上沒有任何資料可作借鑒,因此在很長一段時間裏李開複一直處於摸索狀態。例如,李開複碰到的一個問題是,在一個很大的數據庫中以統計的方式做識別,由於數據庫很龐大,用常規的辦法會占用很多時間。這個問題一直困擾著李開複。

這時候的李開複還有一份來教一批天才高中生如何編程的工作,他為這些高中生安排的課程是為一種叫做“奧賽羅”的棋編製程序。在上課的時候,李開複發現可以在“奧賽羅”上徹底檢驗統計的方法。“奧賽羅”每一步的變化到最後都將是一個很大的數據庫,而通過統計的方法,可以檢驗每一步最後輸贏的概率,這與他的研究不謀而合。李開複索性向導師請了一個月的假專門研究“奧賽羅”,結果做起來才發現困難超過了他的想象,當中李開複和一個學生設計了很多算法,把原來隻有400行的程序增加到20000行,他們大約花了一個月做好了係統,又用兩個月才把統計方法做進去。這也大大超出了當初他和瑞迪教授承諾的一個月的時間。然而成功也超過了李開複的想象:在新的算法下,“奧賽羅”的運算快了1000倍,運行速度的提高也為大數據庫下用統計進行語音識別的成功奠定了基礎。

李開複的研究後來取得了成功,瑞迪教授“我不同意你,但是我支持你”的態度至關重要。但最關鍵的是,李開複能夠勇於提出自己的觀點,而且在導師的問詢下仍然堅持自己的主見,不輕易放棄。