正文 12.6神經網絡模式識別的典型方法(1 / 1)

在各種人工神經網絡模型中,在模式識別中應用最廣泛的也最成功的是多層前饋網絡和自組織網絡。其中多層前饋網絡多采用有監督的學習方式進行訓練,通常有以下兩種應用方式。

1多輸出型

網絡的每一個輸入節點對應樣本的一個特征,輸出層節點等於類別數,一個輸出節點對應一個類。在訓練階段,如果輸入訓練樣本的類別標號是f,則訓練時的期望輸出設為第f個輸出節點為1,其餘輸出節點均為0。在識別階段,當一個未知類別的樣本作用到輸入端時,考察各輸出節點的輸出,並將這個樣本的類別判別為與輸出值最大的那個節點對應的類別。在某些情況下,如果輸出最大的節點與其他節點輸出的差距較小(小於某個閾值),則被認為拒絕決策,這就是多層感知機進行模式識別的最基本方式。

實際上,多輸出型神經網絡還存在許多其它的形式,上麵這種方式隻是其中的一個特例,把它稱為“1-0”編碼模式。更一般地,網絡可以有多個輸出節點,用它們的某種編碼來代表一個類別。

2單輸出型

這種網絡的每一個輸入節點對應樣本的某一特征,而輸出層節點隻有一個。為每一個類建立一個這樣的網絡(網絡的隱含層節點數可以不同),對每一類進行分布訓練,將屬於這一類的樣本的期望輸出設為1,而把屬於其它類的樣本的期望輸出設為0。在識別階段,將未知類別的樣本輸入到每一個網絡,如果某個網絡的輸出接近1(或大於某個閾值,比如05),則判斷該樣本屬於這一類;而如果有多個網絡的輸出均小於閾值,則或者作出拒絕,或者將類別判斷為具有最大的那一類;當所有網絡的輸出均大於閾值時也可采取類似的決策方法。

顯然,在兩類情況下,我們隻需要一個單輸出網絡即可,將一類對應於輸出1,另一類對應於輸出0,識別時隻要輸出大於05則決策為第一類,否則決策為第二類;或者也可以在兩類之間設定一個閾值,當輸出均在這個閾值之間時被認為拒絕決策。

自組織神經網絡可以較好地完成聚類的任務,其中,每一個神經元節點對應一個聚類中心,與普通聚類算法不同的是,所得的聚類之間仍保持一定的關係,也就是在自組織網絡節點平麵上相鄰或相隔較近的節點對應的類別,它們之間的相似性要大於相隔較遠的類別之間的相似性。因此可以根據各個類別在節點平麵上的相對位置進行類別合並和類別之間關係的分析。

自組織特征映射最早的提出者Kohonen的科研組就成功地利用上述原理進行了芬蘭語話音識別。他們的做法是,將取自芬蘭語各種基本語音的各個樣本按一定順序輪流輸入到一個自組織網絡中進行學習,經過足夠次數的學習後這些樣本逐漸在網絡節點中形成確定的映射關係,即每個樣本都映射到各自固定的一個節點(在這個樣本作輸入時,該節點為最佳匹配節點或具有最大輸出),而映射到同一節點的樣本就可以看做是一個聚類。學習完成後,發現不但同一聚類中的樣本來自同一音素,而且相鄰節點對應的聚類中的樣本往往也來自相同或相近發音的音素。在識別時,對於新的輸入樣本,將其識別為它映射到的節點所標的發音即可。

這種做法實際上是在非監督學習的基礎上進行監督模式識別。其最大的優點就是,最終的各個相鄰聚類之間是有相似關係的,即使識別時把樣本映射到了一個錯誤的節點,它也傾向於被識別成同一個音素或者一個發音相近的音素,這就十分接近於人的識別特性。