求回歸係數
若已知一組數據{(X1,Y1),(X2,Y2)……,(Xn,Yn)},運用最小二乘法原理,可得到a、b的計算公式如下:
a=ni=1yin-bn-ni=1xi
b=ni=1xiyi--ni=1xi-ni=1yi/n-ni=1x2i--ni=1x2i/n
相關性檢驗
當Y和X兩個變量不存在相關關係或相關關係不密切時,建立一元回歸方程是沒有實際意義的,即不能用於預測。為此,在根據已知數據求兩個變量的線性回歸方程之前,應首先判定兩個變量是否具有線性相關及其密切程度,這種判定稱為相關性檢驗。
兩個變量之間的線性相關關係,可以通過作散點圖的方法粗略估計,也可以通過計算兩個變量的相關係數來判定。相關係數通常用字母R表示,根據協方差與方差之比的定義,R的表示式為:
R=xi-XYi-Y-(xi)2-Yi-Y2
當R=1時,表示Y與X為完全線性相關,所有的點(xi,Yi)都處在回歸直線上,完全可以用線性方程描述;
當R=0時,表示Y與X變量為零相關,說明它們之間沒有線性關係;
當0<R<1時,表示部分相關,但是隻有當相關係數R的絕對值大於一定程度時,才能使用直線回歸預測模型進行預測。
置信區間
由於預測值是對未來的一個估計,對預測有意義的應該是一個區間或範圍。以預測值為中心,確定一個達到一定概率的預測值範圍,這個範圍稱為置信空間。
按照數據統計的定義,標準差的計算公式如下:
S=ni=1y2i-a-ni=1yi-b-ni=1xiyin-2
求得標準差S後,在正態分布的條件下,預測值y的實際範圍在y±S的區間內的概率近似為68.3%,在y±2S的區間的概率近似為95.4%,在y±3S的區間內的概率近似為99.7%。
②多元回歸模型。
由於許多多元非線性回歸問題可以轉化為線性回歸問題,所以這裏介紹多元線性回歸模型。
多元線性回歸的原理與一元線性回歸的原理基本相同。一般地,設有m個自變量(x1,x2……,xm),因變量Y的多元線性回歸表示如下:
Y=a+b1x1+b2x2+……+bmxm
又設每個自變量xI及因變量yI都有n個數據,則係數的計算步驟如下:
第一步:標準化
令xi為xi的平均值,lii為xi的方差
y=1n-ni=1yi
Sy=ni=1yi-y2
bi=biliilm=1,m=1
第二步:建立標準回歸係數的正規方程
r11b1+r12b2+……+r1mbm=r1,m=1
r21b1+r212b2+……+r21mbm=r2,m=1
rm11b1+rm12b2+……+rm1mbm=rm,m=1
其中:
rij=lijliiljj
lij=nk=1xik-xjkxjk-xj
可用線性代數中的迭代法、LU分解法等來解方程組。
第三步:建立標準回歸方程
y=b1x′1+b2x′2+……+bmx′m
第四步:建立一般回歸方程
Y=a+b1x1+b2x2+……+bmxm
bi=bilm+1,m+1lii
a=xm+1--mi=1bixi
當然,該回歸方程是否可信,還必須對下列參數進行分析。
殘差平方和
Q=mi=1Yi-Y^i2
Q愈小,表示Y與這些自變量的線性關係愈密切。
剩餘標準差S
S=Q/(m-n-1)
S值愈小,從回歸方程得出的預測值就愈精確。其中m-n-1叫做自由度。
2)Cobb-Douglas模型法。
著名的Cobb-Douglas方程Y=AKαL1-α是從曆史統計數據中歸納出人力資本和物質資本這兩個生產要素對經濟增長的關係。式中,Y代表產量,L代表人力資本投入量。K代表資本投入量,A為正值,α代表由物質資本投資引起的產量增長所占的相對份額,1-α代表由人力資本投資引起的產量增長所占的相對份額。根據美國20世紀以來的統計數據得出,α=0.25,1-α=0.75.也就是說,同期,人力資本對經濟增長的貢獻是物質資本的3倍。這一結論已經被美國資本與工資收入之比為1:3所證實。
3)包絡法DEA。
在20世紀70年代末,美國運籌學家A。Charnes和W。Cooper提出數據包絡分析(Data Envelop Analysis,DEA)用於評價相對有效性。
人才自主創新係統將利用不同種類的資源支撐自已的運行。稱(x;y)為係統運行的輸入輸出向量。構造集合T={(x;y)x是輸入部分,y是輸出部分}。
對用(X;Y)描述的追求價值的人才自主創新係統而言,規定該係統追求價值的效率函數為:
h=mj=1uiyj-nk=1vkxk-mj=1uj=1,-nk=1vk=1,uj>0,uk>0,DEA模型很多,首先討論最基本的C2R模型。假設有q個同時接受相同評價的人才自主創新係統,第i人才係統的效率函數記為hi0,記U=(u1,u2……,un)T,V=(v1,v2……,vm)T,第i人才係統的輸入為X=(x1,x2……,xn)T,相應的輸出為Y=(y1,y2……,ym)T,則可構造如下的模型:
maxhi0=vTYi0uTXi0,s。t。vTYiuTXi≤1(i=1,2……,q),VT≥0,UT≥0,這個模型稱為C2R模型,是利用其他人才係統的效率函數值在[0,1]上變化為約束,求自己的最大效率。利用Charnes-Cooper變換:
t=1UTXi0,ω=tU,μ=tV
則C2R模型等價於模型
maxMp=μTYi0,s。t。ωTXi-μTYi≥0(i=1,2……,q),ωTXi0=1,ω≥0,μ≥0,記這個模型為C2RP,模型C2RP是線性規劃模型。為了對評價對象之間的技術有效性進行相對評價,利用模型C2RP建立另一個線性規劃模型。
maxμTYi0+μi0=Mp,s。t。ωTXi-μTYi-μi0≥0(i=1,2……,q),ωTXi0=1,ω≥0,μ≥0,記這個模型為C2RPG,可用於評價不同對象間的技術有效性。
如果對第i0人才係統有模型C2RP的最優解μ0,ω0滿足Mp=μ0T+μ0TYi0=1,則稱該人才係統相對於模型C2RPG為弱DEA有效。
如果對第i0人才係統有模型C2RP的最優解μ0>0,ω0>0,且滿足Mp=μ0T+μ0TYi0=1,則稱該人才係統相對於模型C2RPG為DEA有效。
引入非阿基米德無窮小量(記為ε,一般取ε=10-5)將模型C2RPG變換為:
min[θ-ε(е-Ts-еTs+)],s。t。-qi=1Xiλi+s-=θXi0,-qi=1Yiλi+s+=Yi0,λi≥0(i=1,2……,q),s-≥0,s+≥0,е-T=(1,1……,1)∈En,еT=(1,1……,1)∈Em,該模型記為C2RPGε。
設第i0人才係統關於模型C2RPGε的最優解為θ0,λ0,s+0,s-0,若θ0=1,則第i0人才係統關於C2RPG為弱DEA有效;若θ0=1,且s+0=0,s-0=0,則第i0人才係統關於C2RPG為DEA有效;在其他人才係統輸入輸出有變化的條件下,第i0人才係統采用。