正文 11.3模型的構建(1 / 1)

采用3種建模方法進行探索和評價。

插值法

插值法又稱“內插法”,是利用函數f(x)在某區間中若幹點的函數值,作出適當的特定函數,在這些點上取已知值,在區間的其他點上用這特定函數的值作為函數f(x)的近似值。

如表11-2所示,為播種日期與生長階段具體日期的一組參數舉例。首列為播種日期,其餘各列分別為出苗期、子葉展開期、第1片真葉出現以及開花期。如對於5月2日播種的,可查得V1應該在6月24日。

該表的製作主要按插值,分兩步進行。例如,V1期所有日期可以作如下插值處理:相鄰兩播種期(如5月1日和5日,對應自然天數為95和100);(2)找出相對應的V1階段大田記錄數據(如6月8日和13日,或自然天數124和127,如果有2個或多個數據集,則取其平均值);(3)計算天數增長量:(127–124)/(100–95)=060;(4)最後,在每個播種日期上,V1出現的日期加060d,可得各個播種日期下V1階段可能出現的日期,如5月3日播種的V1應該出現在6月25日(6月24日+06);5月8日播種的V1應該出現在6月30日等等。

回歸分析

運用SAS調查評價了各種模型,包括線性的和對數回歸等,以建立各生長階段出現的日期與遺傳、環境等因子之間的定量關係。涉及的預測變量包括播種日期(以自然天數表示),種植年份,熱量(以GDD表示),規一化的生長階段和氣溫度。為了簡化模型,其他因素如土壤濕度、蟲害、病害和雜草等已控製在最佳狀態,未列入預測參數中。采用SAS的前向逐步回歸分析法,從所有候選參數中確定最後的預測參數組合。

神經網絡模型構建

人工神經網絡簡稱神經網絡,它是一種模仿動物神經網絡行為特征,進行分布式並行信息處理的算法數學模型。這種網絡依靠係統的複雜程度,通過調整內部大量節點之間相互連接的關係,從而達到處理信息的目的。

P(ackPropagation)網絡是1986年由Rumelhart和McCelland為首的科學家小組提出,是一種按誤差逆傳播算法訓練的多層前饋網絡,是目前應用最廣泛的神經網絡模型之一。P網絡能學習和存貯大量的輸入-輸出模式映射關係,而無需事前揭示描述這種映射關係的數學方程。它的學習規則是使用最速下降法,通過反向傳播來不斷調整網絡的權值和閾值,使網絡的誤差平方和最小。P神經網絡模型拓撲結構包括輸入層(input)、隱含層(hidelayer)和輸出層(outputlayer)。

對營養期和生殖生長期分別構建P神經網絡,分別稱之為P1和P2。

(1)神經網絡結構設計。多層網絡在處理模式識別領域的問題時的優點是較容易完成學習目標,更能適應平移、旋轉或其他變換的不變性。缺點是:存在著較多的神經元節點和連接權值,因而需要更多的調整與運算,計算量較大,易於陷入局部極小值中。營養期P1選擇具有1個隱含層的3層神經網絡結構。生殖生長期P2選擇具有2個隱含層的4層神經網絡結構。

(2)P1的輸入為播種日期pd和營養期。由於播種日期限定為5月1日-5月15日這個範圍,為了簡化輸入,將播種日期定為1-15這15個數值。

(3)隱含層節點數的確定。對於隱含層節點數,到目前為止仍不能通過理論方法確定,隻能憑經驗或實驗估計。根據訓練得到P1的最佳隱含節點數為6個,P2的兩個隱含層各有4個節點。

訓練過程及結果分析

每年對不同播種日期的地塊進行記錄,可得數據20×15組,前4年的數據作為訓練數據,共80×15組。根據營養期和生殖生長期把數據分成兩部分,分別對P1和P2進行訓練。

訓練結束後,對第5年紀錄的數據進行驗證,將實測數據平均值與預測數據進行比較