一種基於遷移極速學習機的人體行為識別模型
學術研究
作者:支周 屈肅
摘 要:為了解決由於每個用戶的行為都有自身的特點和習慣,加之手機放置位置和方向的不確定性及多樣性所導致的通用模型識別率低的問題,文章提出了利用TrELM(Transfer Extreme Learning Machine)算法實現遷移學習,並基於智能手機中內置的加速度傳感器進行信息采集並通過機器學習方法構建人體行為識別模型。該方法是一種基於參數遷移的方法,通過對ELM的目標函數進行修改,引入一個可以表示兩域差異的遷移學習量,從而實現ELM模型的遷移學習。實驗結果表明,該模型可以有效的提高新用戶的行為識別正確率。
關鍵詞:遷移學習;人體行為識別;極速學習機;機器學習
中圖分類號:TP391 文獻標識碼:A 文章編號:2095-1302(2015)09-00-03
0 引 言
基於智能手機進行人體行為識別是移動情景識別的一個重要研究方向,在健康監控、行為檢測、老年人監管等方麵有廣泛應用[1]。在構建行為識別模型時,利用智能手機中內置的三軸加速度傳感器,對人們多種日常行為的加速度數據進行采集,並通過機器學習的方法,構建用戶行為識別模型[2]。
由於每個用戶的行為都有自身的特點和習慣,加之手機放置位置和方向的不確定性及多樣性,導致不同用戶的行為加速度數據特征的數據分布差異較大,以至於識別模型的不適用性大大增加。為了解決識別模型的自適應性問題,並且以最小的代價獲得較大收獲,這就需要利用遷移學習對通用模型進行修改。
為了解決通用行為模型在麵對新用戶時的不適用問題,本文提出了TrELM算法實現遷移學習。該方法是一種基於參數遷移的方法,通過對ELM的目標函數進行修改,引入一個可以表示兩域差異的遷移學習量,實現ELM模型的遷移學習。利用TrELM算法實現通用模型的遷移,首先利用ELM分類器構建通用行為識別模型,可以得到源域中識別模型的輸出權值向量βS;之後通過對新用戶的少量行為樣本進行學習,修改通用模型的輸出向量為βt,實現對通用模型的修改,完成具有遷移學習功能的行為識別模型。
1 已有研究
Dai提出了一種TrAdaBoost方法[3],該方法的假設前提為源域和目標域實例數據的特征和標記相同,但數據分布不同。該方法利用AdaBoost方法構建了一個數據樣本權值自動調整的機製,在迭代過程中對源域和目標域的數據采取不同的權重調整機製,進而可以實現減少有害數據對目標域學習的影響。該方法雖然可以借助源域的部分數據樣本作為輔助數據來在目標域進行學習,但是當源域和目標域的數據樣本相似性較差時,負遷移效果會增加。Jiang等在文獻[4]中的處理辦法是對源域數據樣本進行領域適應性的轉變,將產生負遷移效應的源域樣本刪除後再進行賦值,增加其在目標域中的權值大小,最終可以利用具有預測標簽的目標域樣本對源域樣本的質量進行提升。
Dai等人在文獻[5]中提出翻譯特征遷移學習方法,該方法是一種較為基礎的特征遷移學習方法,主要通過對跨領域的特征進行學習,用以解決訓練數據和測試數據所屬特征空間不同的問題,利用不相關的數據幫助目標分類和聚類學習。
Lawrence在文獻[6]中提出了一種高效算法MT-IVM,該方法構建了多任務的高斯過程,在其特性上獲取知識,以實現知識共享。Bonilla在文獻[7]中也研究了高斯過程下的多任務學習,提出了基於任務間自由形式的協方差矩陣,進而模擬交互任務的依賴性,最終利用高斯過程中知識對任務間的相互關係進行學習。Schwaighofer等人構建了基於高斯過程和貝葉斯算法的統一模型,以解決多任務學習問題[8]。在文獻[9]中,Evgeniou提出了一種以分層貝葉斯模型為前提的規則化框架,並實現了在遷移學習中的應用,解決了多任務學習的問題。該方法的實現基於如下假設,即在麵臨每個任務時,將SVMs中的特征分為兩部分,一部分是所有任務都具有的共同體,另一部分是針對某個任務的專有部分,這種方法適用於具有較多樣本,且源域和目標域樣本較為單一的情況。
Mihalkova在文獻[10]中提出了TAMAR算法,通過馬爾科夫邏輯網絡在相關聯領域間遷移相關知識。在馬爾科夫模型中,關聯領域的實體通過預測表現出來,他們的關聯性可由一階邏輯表示。該方法基於這樣一個事實,若兩個域是相關的,則存在一種從源域到目標域的實體之間及關係的映射。TAMAR算法分為兩個階段,首先構造一個基於加權的對數似然度的從源域到目標域的映射;之後利用FORTE算法修正目標域的映射結構,修改後的馬爾科夫邏輯網絡可以用作目標域的關聯模型來使用。此外,Davis等人構建了二階馬氏邏輯,實現相關知識的遷移學習,該方法根據反相馬爾科夫鏈的形式實現源域中某一樣本的架構構造,進而可以在目標域中獲取該樣本的公式。