正文 第八章 參數估計數理(1 / 2)

統計的基本問題是統計推斷,統計推斷包括估計和假設檢驗兩個部分。本章討論估計問題中的一種——參數估計。

參數估計是根據總體的已知樣本,對總體分布中的未知參數或數字特征作出估計。按估計的不同要求,參數估計分為點估計和區間估計。

1點估計

設是總體分布中的未知參數或數字特征,是總體的一個樣本。根據樣本構造一個適當的統計量用以估計,我們稱口為日的估計量;對應於樣本的一個觀察值為目的估計值,並仍簡記為舀。這種給出一個統計量作為總體未知參數或數字特征目的估計量,並把估計量的值作為p的估計值的方法稱為點估計。有時不需區別估計量或估計值,也稱為目的一個點估計。

點估計又稱為定值估計。構造估計量的方法很多,本節介紹常用的矩估計法和最大似然估計法。

一、矩估計法

因為樣本矩依概率收斂於總體矩,所以對於總體矩自然考慮用相應的樣本矩進行估計。

例如對總體均值EX用相應的樣187本均值x進行估計,即對總體方差DX用相應的樣本方差。

定義1對總體矩用相應樣本矩進行估計的方法稱為矩估計法。

矩估計法是一種最常用的點估計方法。它是由英國統計學家K·皮爾遜在1894年首先提出的一種方法,該方法具有簡單易行的優點。

二、最大似然估計法

在理論上比較優良、適用範圍較廣的點估計方法是最大似然估計法。它是英國統計學家R·A費歇在1912年提出的。為了說明最大似然估計法的原理。先考慮一個簡單的估計問題。設在袋中裝有若幹自球和黑球,隻知兩種球的數目之比是1:3,但不知哪種球多,即取到黑球的概率,若有放回地隨機抽取兩球,全得黑球,試問袋中是黑球多還是白球多?這個問題似乎從直覺上就可以回答是黑球多。下麵從概率上來分析一下這個判斷。

該事件發生的可能性大因此推測即黑球多於白球。前麵作出的袋中黑球多的直觀判斷,實際上是有意無意地用到了“概率最大的事件最可能發生”的原理。從參數估計的角度來說,問題就是對總體的參數p有兩種可供選擇的估計自然應該選取較大的作為p的估計。

如果對p有多種可供選擇的估計,自然也應選取使觀察結果出現概率最大的一個p作為p的估計。這就是最大似然估計法的原理。

一般地,設總體X的概率密度(分布列或分布密度的統稱)為若x為離散型隨機變量,一個樣本,則樣本的聯合概率密度,當X為離散型時,它描述了樣本取得樣本點的概率;當X為連續型時。它雖然並不表示概率,但表示樣本落入樣本點鄰域內的概率。

綜上所述,給出最大似然估計的定義。

可見,求總體未知參數的最大似然估計問題就是在給定樣本後,求似然函數的最大值問題。很多情況下可利用微積分求函數極值的方法。因為有相同的極大值,所以,為避免求連乘積導數的繁雜計算,常常通過下式等產求解最大似然估計稱為似然方程。

2估計量的評價標準

構造估計量的方法很多。估計量的形式可能由於構造方法的不同而不同,於是產生了怎樣選擇一個優良估計的問題。為此要確定出“優良性”的評價準則。根據問題的實際背景及理論上的方便,可以選擇不同的評價準則。這些準則分為兩大類:一類是小樣本準則,即樣本容量固定時的優良性準則,常用的有無偏194性與有效性;另一類是大佯本準則,即樣本容量趨於無窮時的優良性準則,常用的是一致性。

一、無偏性

因為參數的估計量是一個隨機變量,所以對估計量的優良性不能僅從其個別觀察值而應從其平均取值去評價。

二、有效性