第八章 千裏之行,始於足下 3 .(1 / 1)

上回說到,我們成功實現了分詞。現在,我們輸入一個句子,AI就可以先對句子進行分詞,後再實現釋。,的問又出現了:釋是成功了,不過句子被拆成多個詞語的連了。問就來了,怎樣識出哪個東西是實,哪個是動作修飾的詞呢?

什思呢?舉個例子。

“小貓吃大魚”,就會被分詞為“小貓”,“吃”,“大魚”。這樣會造成什問呢?就是AI會認為這個句子是個沒有什互聯的東西:“小貓”,“吃”和“大魚”。而人的則是“小貓”這個東西在對“大魚”這個東西進行動作“吃”。

可能有人對於中文母語的慣思維沉溺過久了,無深刻這個例子,為什AI會認為這個句子是個沒有什互聯的東西呢?就是兩個東西呀!

可以有一個更簡單的例子“盜胠篋斛以”。,我現在跟說,這個句子被分詞為“盜”和“胠”和“篋”“斛”“以”“”“”。現在請問:這個句子中,有幾個實的東西?換上生僻字,人們更容易脫離了思維慣,認識到思維的質。當不能排除我的讀中有古文比較的能懂,如古文比較一般不懂思的,往往就無分辨哪是實,哪是動詞修飾。這句話中,有盜賊和篋子是實。這句話的思是“盜賊打開了箱子,用(容積單)斛來。”,在無的下,無分辨哪是實則是現在我的AI麵臨的問。。

問就來了,怎樣識出哪個東西是實,哪個是動作修飾的詞呢?實,這個問也有輪子——麵還沒有釋的“實識”。Hanlp中就有這個功能的訓練模型。用於取一個句子中的實。於是,我用,成功句子實分出為“貓”和“魚”,而自動識動詞“吃”則添為兩個實的節點間的關。

“我真棒!”我拍了拍自己的小臉蛋,鼓勵了一下自己,寸進有寸進的喜悅呀。今的這一章就到這裏啦。