正文 一種基於遷移極速學習機的人體行為識別模型(2 / 3)

本文所提出的TrELM算法結合了參數遷移方法,實現了ELM在模型層麵上的遷移學習功能。

2 基於遷移極速學習機的行為識別模型

目前,針對ELM遷移學習方法的研究主要是基於實例遷移學習方法,基於參數的遷移學習大多是在SVM結構中實現的。遷移學習算法TL-SVM通過對SVM分類器進行深入研究,從判別函數f(x)=wTx+b中發現不同域間的差異體現在其w值上。通過構造可以體現兩域間差異的項μ‖wt-wS‖2,將其添加至SVM目標式中,根據一係列運算規則,即可實現不同域間的遷移學習。

用ELM構建模型,會得到輸出權值向量β,針對數據分布不同的領域,在其上訓練的ELM模型中的β向量必然不同,雖然模型構建時輸入節點加權值向量以及偏差向量均是隨機賦值的,但其模型構建理論可以說明,以不同域數據樣本構建的多個ELM分類模型間的差異,可以用輸出權值向量β表示。

鑒於SVM及ELM的相關性以及基於SVM的遷移學習研究,構造TrELM(Transfer Extreme Learning Machine)算法模型。通過在ELM的目標式中增加μ‖βt-βS‖2項,可以表示兩個域間的差異,通過嚴密的數學公式推導求解後,可以得到目標域內的ELM目標式,進而實現兩域間的遷移學習。其中,‖βt-βS‖2表示兩域分類器之間的差異程度,該值越大則分類器間的差異越大,反之越小;參數μ控製懲罰程度。

3 實驗結果

項目組是以智能手機為背景的行為識別模型的遷移學習,將九名測試者p1至p9按其年齡分布分為A、B、C三組,其中,A組成員為p1-p3,年齡分布為20-30歲,相應樣本集記DA;B組成員為p4-p6,年齡分布在31-40歲,相應樣本集記DB;C組成員為p7-p9,年齡分布在41-50歲,相應樣本集記DC。上述每個樣本集均按比例(1:3)分為兩部分,即DA1、DA2,DB1、DB2和DC1、DC2。

為了論證方法的有效性,實驗將分為遷移學習前和遷移學習後模型的適應性統計兩部分。第一部分分別以DA、DB和DC作為訓練集,構建ELM通用行為識別模型,之後對其餘兩個樣本集進行測試,統計測試集正確率,以衡量未遷移學習時的模型適應性;第二部分是在第一部分的基礎上,以其餘樣本集中較少部分作為遷移學習訓練樣本集,對模型進行TrELM算法的自適應性修改,以測試集正確率作為遷移學習後的模型適應性能力進行統計。每組實驗均進行20次,統計正確率的平均值。

在構建通用行為識別模型時,由於ELM算法的輸入權值向量是隨機賦值的,故隻需要確定隱藏層節點數即可。目前統一規範確定隱藏層數量,隻能靠經驗值確定。選取隱藏層參數為100,以達到構建最優網絡的目的。

另外,在ELM的輸出函數中,C的取值範圍[2^(-10), 2^(25)],選取分類器性能最優時的C值為2^(18)。

在遷移學習過程中,假設TrELM算法的性能是由其相關參數μ和Ct確定的。令μ的取值範圍為[0,1],Ct的取值範圍為[2^(-5), 2^(20)] 。

通過上述表格的第一行可以看出,對於所構建的通用行為模型,在麵臨新用戶時,行為識別正確率較低,平均值最低為64.75%,說明了對新用戶進行行為識別時,通用模型的不適應性以及遷移學習的必要性。通過對比各表格中第一二行的測試集正確率,可以看出,利用新用戶的行為數據進行了基於TrELM算法的模型遷移學習後,行為識別正確率有了明顯提高,表5中正確率的增加幅度最大,為24.63%,說明了TrELM算法可以有效達到遷移學習的目的。

另外,表2和表5中測試集正確率增加值要大於其餘四個表,這是由於當所遷移到的目標域用戶組年齡組成與源域訓練組差異較大時,兩組行為特征值的數據分布也會有較大不同,通用模型的不適應性增大,在這種情況下進行遷移學習,可以得到更好的效果,識別正確率也會有較大提高。