“部分線性模型”研究文獻綜述
商界論壇
作者:周衍琪 劉靜頤 王越
一、前言
回歸模型是統計學中發展較早、理論豐富深厚且應用性強的統計模型。由於實際解決問題的需要,回歸模型一直是處於不斷的發展、進步之中,由參數回歸模型到非參數回歸模型,上個世紀後期又興起了半參數回歸模型。
參數回歸模型有形式Yi=f(Xi;β)+εi,i=1,2,...,n,f為已知函數,β為未知的有限維參數,εi為均值為0的隨機誤差。該模型最重要的是f是已知函數,但實際應用中,不能給出一個已知的函數,所以參數模型在實際中有模型設定的誤差。為了減少模型偏差,、提出非參數回歸模型:設響應變量Y是隨機變量,協變量X是隨機變量或非隨機變量。給定隨機樣本xi,yi,1≤i≤n,可建立回歸模型:yi=m(xi)+εi,i=1,2,…n,其中m(.)是未知的回歸函數,εi為隨機誤差。但當協變量X的維數增加時,多元非參數回歸估計的精度下降很快,為了克服這種問題,提出了降維模型--半參數回歸模型。
接下來本文主要討論的是半參數模型中一類很重要的模型--部分線性模型,通過查閱大量文獻資料,研究了各個學者在部分線性模型中所做的工作,接下來本文就以文獻綜述的形式一一闡述,首先介紹該模型是怎麼提出的,然後將從統計推斷和大樣本性質這兩個部分闡述各統計學家都做了哪些工作。
二、模型的提出
Engle等(1986)在研究電力與氣候環境之間的關係時給出了部分線性模型,模型為:
Yi=βT0Xi+g(Ui)+εi,i=1,2,…,n,
其中β0是p維參數向量,g(.)是未知函數。模型由兩部分構成:第一部分βT0Xi表示Yi與Xi是線性關係;第二部分g(Ui)表明Yi與Ui是未知的非線性關係。如果使用非參數回歸來處理,將會失去Yi與Xi線性關係的信息,從而導致估計值存在較大的偏差,如果用參數回歸來擬合,一般不能有好的估計。
三、部分線性模型的統計推斷及大樣本性質的文獻綜述
(1)國外研究狀況。Robinson(1988)在非參數分量g(.)取N-W核估計時,構建參數部分β0的加權最小二乘估計和非參數g(.)的估計g∧(.),在一些必要的條件下,分析了的漸近正態性和g∧(.)的收斂速度。同年Speckman(1988)采用參數化形式Wγ逼近非參數分量g(.),然後用最小二乘法構造β0的估計,同樣研究了該估計量的漸近性質。還有一些作者使用光滑樣條方法構造了β0和g(.)的估計量。Heckman(1986)在Xi和Ui獨立的情況下研究了β0的懲罰最小二乘估計的相合性和漸近正態性。 Cuzick(1992)利用漸近估計方程來估計參數,且證明估計量的n相合性。Hamilton和Truong(1997)采用局部線性回歸給出了各未知量估計,證明漸近正態性。Mammen和van de Geer(1997)應用經驗過程理論給出了參數的懲罰擬似然,並推導漸近性質。Xue等(2004)提出了sieve極大似然估計,證明了參數估計的強相合性和漸近正態性,得到了非參數估計最優收斂速度。Ma等(2006)研究了異方差的部分線性回歸模型,構造了未知量相合估計,證明了參數的估計是半參數有效的且具有漸近正態性。Dabo-Niang和Guillas(2010)研究了具有自回歸誤差的部分線性模型,構造了未知量估計量,並證明估計量的相合性和漸近正態性。