當然,可把小組層麵的構念“變革型領導行為”降低到個人的層麵,對應為每個人的數據,然後用以下的數據結構來分析[注意:下表中同一組內的“變革型領導行為”的分數是相同的]。小組員工工作滿意度變革型領導行為組織公民行為1133412532134352145322252k1324k2422k3224那麼,我們分析的統計模型就會是下麵這個模型:組織公民行為jk=β0+β1工作滿意度jk+β2改革型領導行為j+rjk[注:①xjk的下標代表第j組的第k個員工。②rjk是隨機誤差或稱回歸的剩餘誤差(residualerror)。③每一組的每個員工都有不同的公民行為和滿意度,所以這兩個變量的下標是jk。④但是每一組隻有一個領導,一個改革型領導行為的分數,所以這個變量的下標隻有j而沒有k。⑤一般回歸模型習慣把估計誤差稱為εi。但是在HLM的文獻中,研究者習慣把低層階的估計誤差稱為rjk;高層階的估計誤差稱為uj。請讀者留意。]上麵這個回歸模型中,一般會用“最小平方法”或稱“最小二乘法(ordinaryleastsquare,OLS)”來估計未知的參數。但是,這個OLS的分析方法是有一些前提假設的。在兩個層階(個人層麵+小組層麵)的模型中,這些假設不能滿足。因為在一般的OLS回歸分析中Yi=β0+β1xi+ri這個“最小二乘法”的估計對剩餘誤差項ri有3個基本的假設:①回歸估計的誤差ri是正態分布,平均值為0。②對於所有的xi,ri的方差是一個常數σ。③每一個誤差項ri是獨立的。數學上用了一個符號來形容這3個假設:ri~i.i.d.N(0,σ);i.i.d.是“independent(獨立的,假設3),identicallydistributed(相同的分布,假設1和2)”的意思。每一個xi都可能對應有很多個有很多不同的yi,也就會產生很多個ri,“最小二乘法”假設對於同一個xi的所有估計誤差ri需要滿足下麵的條件:①ri成正態分布。②所有的xi的對應的ri的方差是一個常數σ。③兩個誤差(r1與r2)完全無關。
把“最小二乘法”的假設寫成多層線性模型,即yjk=β0j+β1jxjk+rjk
β0j=γ00
β1j=γ10在上式中有很多不同的小組。第j個小組的回歸係數(斜率)稱為β1j,截距稱為β0j。因此,在第一組中(j=1),x對y的影響是但是β11;在第二組中(j=2),x對y的影響是但是β12……。在第二層(每一個不同的小組裏)的模型裏,所有的β1j都是一樣的一個常數γ10。因此,第二層的模型其實沒有很大的意義。可把它改寫成一個簡單的一層線性模型,即yjk=γ00+γ10xjk+rjk但是,當樣本包含了很多小組,而每一個小組內的回歸係數都不一樣的話,“最小二乘法”的ri~i.i.d.N(0,σ)假設就不能成立了。為什麼呢?最顯而易見的,如果每一組的領導風格都不一樣,而這個領導風格卻又影響員工的公民行為的話,那麼在每一組中,單單用員工滿意度(x)來估計公民行為(y)(下麵的公式),誤差rjk中必定會隱藏著該組領導的領導風格的方差在內。但是,同一組的領導是一樣的。因此,在同一組的數據中,這些單單用員工滿意度來估計公民行為的估計誤差,就是該組的領導風格的一個函數,而不是隨機的了。不過,在組與組之間的數據,因為領導風格不同,這個估計誤差還是隨機的,即yjk=γ00+γ10xjk+rjk那就是說,如果每一組有10個員工,又如果用的是上麵的簡單回歸分析,每10個員工(同一組的員工)的數據的回歸估計誤差就是互為相關的,縱然第一個組的10個員工與第二組的10個員工的回歸估計誤差是獨立的。因此,用OLS的分析方法,對於我們的兩層(個人層麵+小組層麵)模型是不正確的。用多層線性模型的表現方法,這樣的模型應該寫為yjk=β0j+β1jxjk+rjkrjk~N(0,σ2)
β0j=γ00+u0ju0j~N(0,τ00)
β1j=γ10+u1ju1j~N(0,τ11)這個模型是什麼意思呢?它代表:①x與y的關係是線性的回歸關係,估計誤差隨機正態分布,誤差均值為0,誤差方差是σ2。②單單用x來估計y是不夠的。但是欠缺的卻不是與x同一個層階的其他變量。因為如果是這樣的話,這些遺漏的其他自變量應該都包含在rjk裏了。在這種情形下,單一層階的回歸模型還是正確的,隻是它的模型R2會比較低,因為遺漏的自變量不在模型中。③相對來說,上麵這個模型所描述的是,遺漏的自變量是會隨著小組(j)而改變的“高層階”的自變量。也就是說,是一個第二層階的變量。可是我們不知道它是什麼。因此唯一可以做的就是在建立模型時,製訂“每一個層階”的估計參數(包括截距β0和斜率β1)都隨著小組(第二層階)而改變,因而成為有下標j的β0j和β1j。④模型中第二條公式β0j=γ00+u0j說明了每一層(每一個小組)中,用x來估計y的截距會隨著j(小組)來改變。而這個截距是一個常數γ00加上一個隨機的誤差u0j。意思就是說,截距會不停地改變,但是我們不知道影響截距改變的是什麼。⑤第二層階的隨機誤差u0j還是正態分布,誤差均值為0,誤差方差是τ00。⑥模型中第三條公式β1j=γ10+u1j說明了每一個小組中,用x來估計y的斜率會隨著j(小組)來改變。而這個斜率是一個常數γ10加上一個隨機的誤差u1j。同樣的,斜率會在組與組之間不停地改變,但是我們不知道影響斜率改變的是什麼。⑦第二層階的第二個隨機誤差u1j也是正態分布,誤差均值為0,誤差方差是τ11。這裏u0j和u1j是一個隨機的變數,即是說每一個小組(或是每一層)的截距(β0j)和斜度(β1j)都不一樣。如果把第二層的公式代入第一層,得yjk=γ00+γ10xjk+[u0j+u1jxjk+rjk]yjk的方差現在為Var(yjk)=Var(rjk+u0j+u1jxjk)
=Var(rjk)+Var(u0j)+Var(u1jxjk)
=Var(rjk)+Var(u0j)+x2jkVar(u1j)在多層線性模型裏,第一層每個小組內的隨機變異“var(rjk)”稱為σ2。第二層中各小組的截距的方差“var(u0j)”稱為τ00。第二層各小組的斜率的方差“var(u1j)”稱為τ11,故Var(yjk)=σ2+τ00+x2jkτ11因此,不同於“最小二乘法”的假設,yij在多層線性模型裏的誤差包括了3個部分:①第一層的估計誤差(σ2)。②第二層的截距的方差(τ00)。③第二層的斜率的方差(τ11)
這裏有一點需要注意,τ00和τ11是真實的小組之間截距和斜率的方差,但是σ2卻是抽樣產生的隨機誤差的方差。因此,多層線性模型的學者一般將τ00和τ11稱為真實方差(truevariance),σ2為誤差方差(errorvariance)。關於這一點,我們在下麵HLM的參數估計中會詳細解釋。在上麵的模型中,我們說我們不知道影響每個小組的截距和斜率的是什麼。但是,這不一定正確。如果理論告訴了我們,影響小組的截距和斜率的是領導風格的話,我們的模型應該是如何呢?如果我們把每一個領導的領導風格稱為Wj(每個領導在每一組的領導風格都不同,但是在同一個組內,因為是同一個領導,領導風格是一樣的,因此W有j的下標),那麼,根據一般習慣使用的線性模型,我們就會有以下的模型:yjk=β0j+β1jxjk+rjkrjk~N(0,σ2)
β0j=γ00+γ01Wj+u0ju0j~N(0,τ00)
β1j=γ10+γ11Wj+u1ju1j~N(0,τ11)上麵的模型與前麵的一個模型是一模一樣的,唯一的區別是,現在知道每一組的截距和斜率都與領導風格有線性的(簡單的回歸)關係。自然領導風格也不一定可以完全解釋“組間的”截距和斜率的所有差異。因此,u0j與u1j還是會存在,代表了用領導風格(Wj)來估計截距和斜率時,所剩下的估計誤差(或稱殘差)。現在回到組織研究例子。開始時介紹的“最小二乘法”有一個很大的假設,就是在不同的小組裏,“工作滿意度”和領導的“改革型的領導行為”對員工的“組織公民行為”影響是一樣的。而對於剩餘誤差項ri也有相應的假設。但是,上麵的分析告訴我們,當每一個小組的截距和斜率都不一樣時,“最小二乘法”的假設就不再成立了。如果仍然用原來回歸的方法對參數進行估計,估計值是有誤差的、不準確的。這時,就要采用多層線性模型了。13.2.2多層線性模型的組織研究例子借用了Hofmann(1997)的理論模型作為例子。這個理論是員工的心情會影響他們幫助同事的傾向。員工的心情(mood)越好,幫助同事的傾向就越大。我們進一步地假設兩個同事所屬部門的實際距離(辦公距離)會影響他們互相幫助的傾向,自然我們比較容易幫助離我們比較近的同事。“辦公距離”也影響了“心情”與“幫助同事傾向”的關係。如果部門的實際距離越遠,在同樣的“心情”狀況下,自然同事互相幫助的傾向越低(因為距離使幫助變得更困難)。當部門的距離越近的時候,心情與幫助同事的傾向的關係就越明顯。這裏員工的“心情”是個人層麵的變量,“幫助同事傾向”也是個人層麵的變量。“辦公距離”卻是一個部門層麵的變量,因為同一個部門工作的人與他人的“辦公距離”是一樣的。多層線性模型假設了“心情”和“幫助同事傾向”的線性關係(關係包括截距(intercept)和斜度(slope)在每一個高階層麵(部門)都可能不同。而不同部門的截距和斜度是“部門辦公距離”的直線函數。
數學上,這個“二層線性模型”可用以下方程式表示:個人層麵:(幫助同事傾向)jk=β0j+β1j(心情)jk+rjk部門層麵:β0j=γ00+γ01(辦公距離)j+u0j部門層麵:β1j=γ10+γ11(辦公距離)j+u1j上麵第一個公式表示了第j個部門的第k個員工的“心情”和他“幫助同事傾向”的關係。其中有平均在部門j的員工的“幫助同事傾向”(β0j),再加上部門j的員工k的心情對“幫助同事傾向”的影響,即(心情)jk再加上一個隨機變量rjk。第二個公式表示了每一個部門的平均幫助同事傾向(β0j)是受“辦公距離”影響的。除了一個全公司的平均幫助同事傾向(γ00)外,還有個別部門辦公距離的影響(γ01)和一個在部門層麵的隨機因素(u0j)。第三個公式表示了每一個部門中員工“心情”對“幫助同事傾向”的影響(β1j)是由一個平均“心情”對“幫助同事”的影響(γ10)加上一個“辦公距離”對“‘心情’→‘幫助同事’”的影響(γ11),再加上一個部門層麵的隨機因素(u1j)。如果把方程(4)和方程(5)代入方程(3),得(幫助同事傾向)jk=[γ00+γ01(辦公距離)j+u0j]+[γ10+γ11(辦公距離)j+u1j](心情)jk+rjk(幫助同事傾向)jk=[γ00+γ01(辦公距離)j+u0j]+[γ10(心情)jk+γ11(辦公距離)j(心情)jk+u1j(心情)jk]+rjk(幫助同事傾向)jk=γ00+[γ01(辦公距離)j]+[γ10(心情)jk]+[γ11(辦公距離)j(心情)jk]+[u0j+u1j(心情)jk+rjk]這裏可知,γ00是平均員工對“幫助同事傾向”的影響(meaneffect);γ01是“辦公距離”對“幫助同事傾向”的直接影響(maineffect);γ10是“心情”對“幫助同事傾向”的直接影響(maineffect);γ11是“辦公距離”對“‘心情’影響‘幫助同事傾向’”的影響。也就是說;γ11反映了“辦公距離”作為一個跨層階的調節變量的角色,γ11反映了“辦公距離”調節了“心情”對“幫助同事傾向”的影響。13.3HLM的一般性模型看過了一個實際的例子以後,為了簡化起見,以下開始用數學符號來解釋多層線性模型在研究中的運用。用一個最簡單的模型:在第一層麵隻有一個自變量(稱為X),在第二層麵也隻有一個自變量(稱為W)。在上麵的例子中,X就是“心情”,W就是“辦公距離”。
一個最簡單的二層線性模型就是:第一層階:Yjk=β0j+β1jXjk+rjk第二層階:β0j=γ00+γ01Wj+u0j
β1j=γ10+γ11Wj+u1j如果第二層麵是不同的工作小組的話,數據的排列就會如下:YXY11Y12Y13Y14Y15X11X12X13X14X15小組一
Y1k=β01+β11X1k+r1k
X1k是第1組的第k個員工的自變量數值Y21Y22Y23Y24X21X22X23X24小組二
Y2k=β02+β12X2k+r2k
例如,X24是第2組的第4個員工的“心情”Yj1Xj1Yjk=β0j+β1jXjk+rjk上表顯示了多層線性模型的一個假設,就是X與Y的關係在每一個小組裏都可能不一樣。因為X與Y的關係是線性的,線性關係隻有兩個參數:截距(β0j)和斜度(β1j)。所以每一個小組j的截距和斜度都可能不同。同時,多層線性模型更假設每一組的截距和斜度都與一個第二層變量有直線關係,故β0j=γ00+γ01Wj+u0jβ1j=γ10+γ11Wj+u1j講到這裏,我們可用下表總結這個最簡單的二層線性模型:第一層第二層方程式Yjk=β0j+β1jXjk+rjkβ0j=γ00+γ01Wj+u0j
β1j=γ10+γ11Wj+u1j單位員工小組參數β0jβ1jγ00γ01γ10γ11自變量XjkWj隨機項rjku0ju1j隨機方差Var(rjk)=σ2Var(u0j)=τ00Var(u1j)=τ11Cov(u0j,u1j)=τ11第一層階:Yjk=β0j+β1jXjk+rjk第二層階:β0j=γ00+γ01Wj+u0j