近紅外光譜快速檢測澱粉品質5(3 / 3)

(2)用GBT12087-2008澱粉水分測定——烘箱法對44個訓練樣品的實際含水量進行測定,將測得的數據填進比較組分列中。如圖45所示。

圖45將烘箱法測得的澱粉訓練樣本實際含水量數據填入比較組comp1

六、光譜數據的預處理

經光譜最優化分析,結合偏最小二乘法,分別使用一階導數、消除常數偏移量、多元散射校正法、矢量歸一化等預處理方法建立分析模型。以各模型的決定係數R2和正交標準差RMSECV作為模型精度的評價指標。處理光譜後,建立的模型具有相對其他預處理方式更好的模型精度,R2為9955,RMSECV為10301,其訓練結果較為精確。

圖46因子數與RMSECV關係

圖47澱粉含水量的預測值與化學值相關曲線

七、澱粉NIR模型的校驗

將利用濃度梯度法選取的14個預測集樣品代入模型中進行澱粉含量的預測,得到預測決定係數R2為9997,正交標準差RMSEP為00104,其預測值與標準值如圖48所示,預測曲線與標準曲線夾角很小,可見預測值趨近於真實值,並且樣品散點密集的分布在曲線兩側,預測樣品均在校正模型的可預測範圍內,無超出預測範圍樣品,該模型具有較好的適用性。

圖48個預測集樣品真實值與預測值的相關曲線

表41樣品澱粉含量的真實值與預測值

樣品編號真實值預測值4224422337821208031219951990316252925284203256326682424922479228298129765322319230743618441833540235235524422262217348252125203522939292556205320657

442不同預處理方法對模型預測準確性的影響

在對樣本含水量建立校正模型時,不同的預處理方法,得到了不同的最佳主成分數,其主成分數與RMSECV關係如下圖49所示。

圖491多元散射校正

圖492消除常量偏移量

圖493矢量歸一

圖494一階導數和矢量歸一

圖495一二階導數、矢量歸一、多元散射校正與消除常數偏移量結合

經光譜最優化分析,一階導數、二階導數、多元散射校正法和矢量歸一化等預處理方法得到的校正模型,其決定係數和正交標準差均未達到較高的預測精度,而采用一二階導數、矢量歸一、多元散射校正與消除常數偏移量結合的方法卻得到較高精度的校正模型。

45小結

本章主要研究了NIR光譜分析技術對澱粉中含水量的預測,分別建立定量分析模型並取得了如下結論:

(1)本章詳細介紹了偏最小二乘法的原理和具體算法,在對算法的深入了解下,結合偏最小二乘法進一步探索預測模型的建立方法和優化手段。

(2)針對大量樣本的建模,研究了樣本集的劃分方法,並通過濃度梯度法,根據樣本中澱粉和含水量的分布,反複選取校正集和預測集樣本,使得校正集樣本中包含未知樣本所包含的特征組分,為之後所建模型的預測能力提供可靠的前提,避免因建立不穩定的模型而浪費寶貴的時間。

(3)本章探討了最佳因子數對模型的重要作用。詳細論述了最佳因子數的概念,對預測模型建立產生影響的原因。並在建立含水量的定量模型時,在不同的預處理方法的前提下用實例研究了最佳因子數對模型預測能力的影響。

(4)本章研究了不同預處理方法對模型預測準確性的影響,分析比較了使用一階導數、消除常數偏移量、多元散射校正法、矢量歸一化等預處理方法建立分析模型對澱粉樣品含水量預測的結果,並優化選擇最優的預處理方法。