正文 第三節 數據的統計處理(1 / 3)

隨著計算機技術的普及,使得計算機在實驗數據處理中的作用越發重要,目前有許多現成的統計分析軟件使實驗數據處理變得更加簡單和準確。除了世界著名的統計軟件SAS(StatisticalAnalysisSystem)、SPSS(StatisticalPackagefortheSocialScience)和Statistica之外,Excel、DPS(DataProcessingSystem)等軟件在統計分析中的應用也非常廣泛。Excel和DPS具有方便性和普遍性,很容易掌握和使用,所以本節重點介紹利用Excel和DPS來進行數據統計處理。

一、Excel在數據統計處理中的應用

(一)單因素隨機區組實驗設計的方差分析

【例6】為考察溫度對某種水果貯藏期的影響,選取了5種不同的溫度,在同一溫度下各做3次實驗,實驗數據,確定溫度對貯藏期有無顯著影響。

此例可用“分析工具庫”中的“單因素方差分析”工具來進行單因素隨機區組實驗設計的方差分析。

(1)在Excel 2003中將待分析的數據列成表格。圖中的數據是按行組織的,當然也可以按列來組織。

(2)在【工具】菜單下選擇【數據分析】子菜單,然後選中“方差分析:單因素方差分析”工具,即可彈出單因素方差分析對話框。

(3)按方式填寫對話框。

(4)按要求填完單因素方差分析對話框之後,單擊【確定】按鈕,即可得到方差分析的結果。

其中F-crit是顯著性水平為0.05時的F臨界值,也就是從F分布表中查到的F0.05(4,10),所以當F>F-crit時,因素(溫度)對實驗指標(貯藏期)有顯著影響。P-value所示的是5個組內平均值相等的假設成立的概率為0.0299%,顯然,P-value越小說明因素對實驗指標的影響越顯著。

(二)兩因素無重複完全隨機實驗的方差分析

【例7】為了考察兩種保藏劑A和B對水果貯藏期的影響,對A取了4個不同水平,對B取了3個不同水平,在不同水平組合下各測了一次貯藏期(年),檢驗兩種保藏劑對貯藏期有無顯著影響。

此例可用“分析工具庫”中的“無重複雙因素方差分析”工具,來判斷兩個因素對貯藏期是否有顯著影響。

(1)在Excel中將待分析的數據列成表格。

(2)在【工具】菜單下選擇【數據分析】子菜單,然後選中“方差分析:無重複雙因素分析”,即可彈出無重複雙因素方差分析對話框。

(3)按方式填寫對話框。在本例中,由於所選的數據區域沒有包括標誌行和列,所以不用選中“標誌”複選框。其他的操作與單因素方差分析是相同的。

由於輸入區域未包括標誌,所以在方差分析表中分別用“行”和“列”代表對應的因素,其中“行”代表是因素A,“列”代表的是因素B,顯然兩因素都對分析結果(貯藏期)有顯著影響。

(三)可重複實驗的雙因素方差分析

【例8】某保藏劑在3種濃度、4種溫度水平下,水果貯藏期的數據,檢驗各因素及交互作用對水果貯藏期的影響是否顯著。

此例可用“分析工具庫”中的“可重複雙因素方差分析”工具,來判斷兩個因素以及兩者的交互作用對實驗結果是否有顯著影響。

(1)在Excel中將待分析的數據列成表格。注意,在每種組合水平上有重複實驗,但不能將它們填在同一單元格中,而是應該按照格式組織數據,而且不能省略標誌行和列。

(2)在【工具】菜單下選擇【數據分析】子菜單,然後選中“方差分析:可重複雙因素分析”,即可彈出可重複雙因素方差分析對話框。

(3)按方式填寫對話框。應當注意的是,這裏的輸入區域一定要包括標誌在內。其中“每一樣本的行數”可以理解為每個組合水平上重複實驗的次數,所以對於本例而言,應填入“2”。其他的操作與單因素方差分析和無重複雙因素方差分析是相同的。

在方差分析表中,其中“樣本”代表的是濃度,“列”代表的是溫度,“交互”表示的是兩因素的交互作用,“內部”表示的是誤差。顯然隻有濃度對貯藏期有顯著影響。

二、DPS軟件在數據統計處理中的應用

DPS數據處理軟件(DataProcessingSystem)是由浙江大學唐啟義教授設計研製的通用多功能數理統計和數學模型處理軟件係統。與國外同類專業統計分析軟件係統(如SAS、STAT、STATISTICA等)相比,DPS係統具有操作簡便,在統計分析和模型模擬方麵功能齊全,易於掌握,尤其是對廣大中國用戶,其工作界麵友好,隻需熟悉它的一般操作規則就可靈活應用。

(一)DPS在正交設計中的應用

【例9】為了提高果汁產率,科技人員考察了pH、溫度、加酶量和過濾時間對果汁產率的影響,進行了這4個因素各2個水平的正交實驗。各因素及其水平。

(1)根據實驗因素水平數以及是否需要估計互作來選擇合適的正交表。此例選用L8(27)正交表。

在DPS軟件中操作如下:選擇【實驗設計】菜單中的“正交設計”中的“正交設計”工具,打開“選擇合適的正交設計表”對話框,選擇“8處理2水平7因素”正交表,點擊“確定”。此時在DPS係統的電子表格中會顯示出所選正交表的因素水平設計方案。

(2)進行表頭設計,就是把實驗中挑選的各因素填到正交表的表頭各列。表頭設計原則是:不要讓主效應之間、主效應與交互作用之間有混雜現象。由於正交表中一般都有交互列,因此當因素少於列數時,盡量不在交互列中安排實驗因素,以防發生混雜;當存在交互作用時,需查交互作用表,將交互作用安排在合適的列上,本例中所述的提高果汁產率實驗,若隻考慮A×B互作,可選用L8(27)正交表,其表頭設計。

表頭設計好後,把該正交表L8(27)中各列水平號換成各因素的具體水平就成為實驗方案。例如,第1列放A因素(pH),就把第1列中數字1都換成A的第一水平(pH為4),數字2都換成A的第二水平(pH為5),以此類推。正交實驗方案。

(4)在DPS處理係統中選擇所用的正交表,然後選擇【實驗統計】菜單中的“正交實驗方差分析”工具見圖6-13。隨後係統會讓用戶輸入實驗因子(處理+空閑因子)的總個數、多重比較方法等,係統一般能自動識別出來,故一般隻需回車。此處注意,在正交設計的方差分析中,如果各列都被安排了實驗因子,當對實驗結果進行方差分析時,就無法估算實驗誤差,於是無法進行方差分析,所以本例中將所選正交表的第六列去掉。

(5)正交實驗部分分析結果。

各項變異來源的F值均不顯著,這是由於實驗誤差自由度太小,達到顯著的臨界F值也過大所致。解決這個問題的根本辦法是進行重複實驗或重複抽樣,也可以將F值小於1的變異項(即D因素和A、B互作)作為空閑因子,將它們的平方和與自由度和誤差項的平方和自由度合並,作為實驗誤差平方和的估計值(SS’e),這樣既可以增加實驗誤差的自由度,也可減少實驗誤差方差,從而提高假設檢驗的靈敏度。

第3和第7列(實際中的第6列)F值很小,作為空閑因子。這時根據提示,輸入空閑因子所在列的序號“3,6”,執行計算後得到結果。

pH、溫度的F值均達極顯著水平;pH×加酶量互作的F值達顯著水平。可見,假設檢驗的靈敏度明顯提高。

(6)對於正交實驗設計,也可以用極差分析法來選擇最優處理。