近紅外光譜快速檢測澱粉品質5(2 / 3)

Y=Bktq(411)(11)分析並確定k的最佳主因子數。

二、待測樣品組分的確定

(1)標準化吸光度向量x;

(2)令k=0,y=0,且再令k=k+1,如式412所示。t=xWTk

y=y+Bktq

x=x-tp(412)(3)若k

43實驗部分

(1)實驗材料

實驗收集了由56個來自不同品牌,不同廠家,不同批次的澱粉樣品(包括土豆澱粉、玉米澱粉、紅薯澱粉、綠豆澱粉等)組成的樣品集。

(2)水含量測定

本實驗的樣品水實際含量均用國標法測得。即采用烘箱法對56個樣本的水含量進行測定,得到的結果作為校正模型建立時水的真實含量。

(3)光譜采集

將56個原始樣品各20g分別裝入近紅外分析儀的固體測量池進行澱粉樣品近紅外光譜采集,樣品杯選用減少光譜散射的高性能樣品杯,采用透反射采樣模式,對12500~4000cm-1譜區掃描,分辨率為8cm-1,掃描64次。澱粉樣品光譜圖如圖41所示:

圖41澱粉樣品光譜圖

44模型建立及預測

441澱粉含水量NIR模型的建立與分析

(1)樣品集數據的分析

為了使得所建立的校正模型對未知樣品有良好的預測能力,校正集樣品的澱粉含水量變化範圍應大於未知樣品的含量變化範圍,並且澱粉的含量在整個變化範圍內是均勻的。基於此,在56個原始的澱粉樣品中按約為3∶1的比例劃分校正集樣本和預測集樣本。其中,按濃度梯度法在不同的含水量範圍內選取42個澱粉樣品用於建立校正模型,剩下的14個樣品用於預測該模型。

(2)最佳主成分數的確定

在建立偏最小二乘校正模型時,其中最主要的問題之一就是主成分數目的確定。其中第一種成分尤為重要,隨著主成分數的增加,其重要程度依次遞減,後麵的很多主成分其實大部分到表征的是噪聲信息。因為如果選取主成分過少,則無法反應出待測樣品的特征組分產生的光譜變化,模型的精度不夠,其預測準確度會隨之降低,這種情況稱為欠擬合。如果選取的主成分數過多,則會加進一些噪聲的主成分,不能得到穩定的模型,其預測能力同樣會隨之降低,這種情況稱為過擬合。

可以采用交互驗證的方法確定最佳主成分數,最小的校正標準偏差(RMSECV)為最佳主成分數,如果幾個主成分數的RMSECV近似,則可選取最小的為最佳主成分數。RMSECV表示建模時采用不同的主成分數該模型理論上達到的最佳預測準確度。RMSECV的計算方法如式413所示。RMSECV=(-y)T(-y)d(413)另外:k=n-k(414)——校正集樣品的預測值;

y——校正集樣品的真實值;

d——校正模型的自由度;

n——校正集樣品數;

k——主成分數。

(3)澱粉NIR模型的建立

經全波段NIR光譜掃描得到光譜信息,如圖42所示。

圖42樣品原始光譜

四、光譜數據的預處理

用OPUS65光譜分析軟件進行數據預處理分析,經過波長最優化後選擇波長範圍為84394~79418cm-1、64645~59708cm-1和5481~39998cm-1的波段進行分析建模,校正集樣本經預處理和波長最優化後的光譜圖如圖43所示。

圖43經預處理後的樣品光譜圖

五、建立與實際澱粉含水量數據的比較組

(1)在建立定量分析2方法中的組分建立一個比較組comp1,單位為mg,用於添加用烘箱法測得的澱粉樣品實際含水量的數據。如圖44所示

圖44建立比較組comp1