第三章基於近紅外的澱粉種類定性分析方法研究
31引言
澱粉是以穀類、薯類、豆類為原料,不經過任何化學方法處理,也不改變澱粉內在的物理和化學特性加工而成的。它是日常生活中必不可少的作料之一,如煎炸烹炒,做湯勾芡都少不了要用到澱粉。隨著食用澱粉在現代食品加工業中的廣泛應用,澱粉生產和加工貿易取得了較大的發展。常見的產品主要有玉米澱粉、馬鈴薯澱粉、紅薯澱粉和綠豆澱粉等,不同種類的澱粉價格差別較大,有的相差高達10倍以上,但是不同種類澱粉顆粒的宏觀外觀和普通物化指標差別不明顯,無法辨認。由於缺乏相應的食用澱粉鑒別檢驗技術標準,國內澱粉市場嚴格監管很難執行。一些不法商家為追求利潤,常把廉價的、大量的玉米澱粉包裝成土豆澱粉或綠豆澱粉來銷售,從而提高銷售價格,從中牟取暴利。為保護合法生產經營者和消費者的利益,有必要進行澱粉種類的鑒別。傳統的感官評定方法一方麵需要經驗,另一方麵其檢測結果受主觀因素影響較大,準確度難以保證。而常規的理化分析方法不僅費時費力,還破壞樣品。因此有必要研究一種簡單、快速、無損的澱粉種類鑒別技術。
近紅外光譜(Near Infrared,NIR)分析技術是20世紀90年代以來發展最快、最引人注目的光譜分析技術,它以其快速、高效、取樣簡單以及無汙染等獨特的分析優點,已廣泛應用於農業、食品、醫藥、石油、化工、煙草、化妝品等行業。在定性分析方麵,近紅外光譜技術已被應用於蘋果、水稻、酸奶和黃酒等的品種鑒別,而對於澱粉品種的鑒別方麵還少見報導。
32基於聚類分析的澱粉定性分析研究
321聚類分析
在對眾多樣本進行模式識別時,人們通常事先並不知道樣品內在的分類。其中無監督模式識別方法在未知訓練集樣本的類別的情況下,同樣可以對樣本進行分類識別。聚類分析法便是無監督模式識別法的代表,其應用十分廣泛。分析流程如圖31所示。
圖31聚類分析流程
一、聚類分析法的原理
在多維空間中,相似的樣本彼此距離應小些,反之,不相似的樣本彼此間的距離會相對較大。也即常說的“物以類聚”,有效地將同類和異類分開,合理地按樣品獨有的特性來進行合理地分類。
這裏的樣本相似表示樣本間的親疏程度,通常用相似係數和距離來表征,將每一個樣本看成n個變量的一個點,在這樣的空間中計算樣本間的親疏程度。相似係數用夾角的餘弦值或相關係數表示。
夾角餘弦如式31所示。cosαij=∑nk=1xikxjk∑nk=1x2ik∑nk=1x2jk(31)xik——第i個樣本的第k個特征變量。
相似係數如式32所示。rij=∑nk=1xik-ixjk-j∑nk=1xik-i2∑nk=1xjk-j2(32)i——第i個樣本所有特征變量的均值;
j——第j個樣本所有特征變量的均值。
距離則多用歐式距離和馬氏距離來表示。
歐式距離如式33所示。Dij=∑nk=1xik-xjk2(33)馬氏距離如式34,35所示。Mij=xi-xjV-1xi-xjT(34)
Vij=1n-1∑nk=1xik-ixjk-j(35)Xi——第i個樣本的行向量;
Yj——第j個樣本的行向量;
V-1——協方差矩陣的逆矩陣。
二、係統聚類分析
係統聚類是聚類分析中應用最為廣泛的一種方法,其基本思想是:首先默認每個樣本各自分別為一個小類,按特定方法規定類之間的距離。由於開始認為每個樣本都是一個類,這就意味著類間距是等價的,經過計算,選擇類間距最小的兩個樣本合成一個新的類,再計算該類與其他類的距離,將距離最近的兩類再合並,重新計算類間距。這樣每經過一次合並,就減少一個類別,直到所有的樣本都歸為一類。得到的結果常用譜係圖表示,根據一定的原則,選擇合理的分類閾值來確定最後係統聚類分析的分類結果。
圖32係統聚類分析流程
根據類間距離的不同定義方式,係統聚類法可分為:最短距離法、最長距離法、中間距離法、重心法和方差平方和法。
1最短距離法:兩個不同類中最短距離的兩個樣本間的距離定義為該兩類之間的距離。其計算如式36所示。Dγi=minDpi,Dqi,i≠p,q(36)2最長距離法:兩個不同類中最長距離的兩個樣本間的距離定義為該兩類之間的距離。其計算公式為Dγi=maxDpi,Dqi,i≠p,q(37)3中間距離法:類與類間的距離采取折中的方法,既不選取兩類中距離最近的兩個樣本,也不選取兩類中距離最遠的兩個樣本的距離。
4重心法:每類在物理意義上都會存在重心,兩類的重心間的距離作為類間的相似性。
5方差平方和法:也稱為Ward法,該法認定準確的分類應滿足類內方差盡可能小,而類間方差盡可能大,其計算如式38所示。Dγi=np+ni×D2pi+ni+nq×D2qi-ni×D2pqnp+nq+ni(38)r——類p和類q聚成的新類;
Dpi——類p和類i的光譜距離;
Dqi——類q和類i的光譜距離;
Dγi——是類r和類i的光譜距離;
np——類p中聚類光譜的數量;
nq——類q中聚類光譜的數量;
ni——類i中聚類光譜的數量。
322方法設計
(1)實驗儀器
采用德國布魯克光學儀器公司傅立葉變換近紅外光譜儀,漫反射樣品杯附件,OPUS65光譜采集及分析軟件。
(2)實驗樣品
實驗用玉米澱粉和土豆澱粉均是從市場購買不同品牌或同一品牌不同批次的澱粉,將其編號,1~26號為土豆澱粉樣品,27~58號為玉米澱粉樣品。
(3)光譜采集
將上述澱粉樣品放置在旋轉樣品台的樣品杯中,然後進行近紅外光譜采集。波數範圍12500~4000cm-1,波長間隔8cm-1,掃描64次後取平均,環境溫度23~25℃。
323光譜采集
26個土豆澱粉樣品和32個玉米澱粉樣品的近紅外漫反射光譜圖如圖33。由圖可以看出,在12500~4000cm-1範圍內較為相似,具有許多澱粉之間的相似信息,峰形、峰位差別很小,無法直接鑒別。利用化學計量學方法將原光譜進行數學處理,采用聚類算法進行鑒別,能突出樣品之間化學成分的細小差異,從而達到鑒別的目的。
圖3358個樣品的近紅外漫反射光譜圖324聚類分析模型的建立
運用聚類分析軟件,從土豆澱粉中選擇22個樣品的原始光譜用作建模,土豆澱粉中的6號、11號、17號和23號用作預測。從玉米澱粉中選擇28個樣品的原始光譜用作建模,玉米澱粉中的30號、36號、41號和50號用作預測,進行聚類分析。光譜預處理方法選擇矢量歸一法,光譜範圍選擇9000~4000cm-1。聚類後結果如圖34。從圖中可以看出,聚類結果與實際樣本分類情況完全一樣,準確率100%。
圖34聚類分析結果
325模型預測能力的驗證
為檢驗聚類分析模型的預測能力,考察模型對預測集樣品的準確率,用該模型分別對6號、11號、17號、23號土豆澱粉樣品和30號、36號、41號和50號玉米澱粉進行驗證,驗證結果如圖35。從預測的結果可以看到預測準確率達到100%。
(a)
(b)
(c)
(d)
(e)
(f)(g)
(h)
(a)6號土豆澱粉預測結果(b)11號土豆澱粉預測結果
(c)17號玉米澱粉預測結果(d)23號玉米澱粉預測結果
(e)30號土豆澱粉預測結果(f)36號土豆澱粉預測結果