正文 第13章多層線性模型(1 / 3)

明白了研究的層次問題後,丟丟非常興奮,因為除了單一層麵的研究以外,自己已經可以開始研究不同層麵的問題了。但是,李老師上次隻是講到什麼是不同層麵的研究以及高層變量如何測量和彙總,如果研究牽涉跨過不同的層階時,該如何處理呢?他記得李老師談過,研究跨層階的問題需要特別的分析工具。因此,今天他特別跑來問李老師,到底分析跨層階數據時,需要什麼獨特的工具。丟丟:“老師,上次你說分析混有不同層階的數據時,我們需要特別的分析工具。那到底是什麼新的東西呢?”老師:“丟丟,上次我講的時候,我隻是點出這個問題而已。其實,沒有一個所謂的‘跨層階的分析工具’,可以幫助我們分析所有的跨層階的數據的。”

丟丟:“老師,那是什麼意思呢?是不是代表有一些跨層階的問題可以有分析工具,有些卻沒有?還是不同的跨層階問題要用不同的跨層階分析工具呢?”老師:“丟丟,其實我們沒有很多套‘不同的’跨層階分析工具。來來去去用的都是線性的回歸分析。不過,處理不同的跨層階問題時,確實是稍微有點不一樣。例如,自變量是高層階、因變量是低層階時,如企業文化影響員工表現時,那是一個方差分析。又如,自變量是低層階、因變量是高層階時,如個別員工的能力影響整個團隊的表現時,那是一個加總到團隊層麵的簡單回歸分析。再如,自變量既有高層階變量又有低層階變量,但因變量是低層階的變量時,我們就可能會用多層線性模型。”

丟丟:“老師,前兩個例子我都可以明白。其實,你在以前都談過了。但是什麼是‘多層線性模型’?是層階回歸分析(HierarchicalRegression)嗎?”老師:“丟丟,不是層階回歸分析。‘多層線性模型’是HierarchicalLinearModel,簡稱HLM。”

丟丟:“HLM?老師,這個東西我好像沒有學過。在什麼情形下才會用HLM來分析數據呢?”老師:“丟丟,在有跨層階的調節或是中介作用時,我們就最有可能使用HLM了。”

丟丟:“跨層階的調節作用?跨層階的中介作用?這些是什麼東西?原來調節和中介還可以跨層階的!”老師:“當然可以,丟丟。現在就讓我們來看一種比較複雜的跨層階分析吧!”

13.1HLM基礎知識1)為什麼要一個新工具?在前一章中介紹了研究中可能會遇到的多層麵問題以及高層麵構念的測量。在介紹“多層線性模型(HierarchicalLinearModeling,HLM)”這個工具以前,首先讓我們解釋一下“多層”線性模型與“單層”線性模型有什麼不同。“單層”或者是“一層的”線性模型就是我們熟悉的回歸分析。在一般的回歸分析中,因變量與自變量是同一個層麵的。為什麼在一些涉及多層問題的分析中,簡單的回歸分析不能滿足我們的需要,而要用一個新的分析工具呢?下麵用一個很簡單的例子來說明其中的原因。2)一個假設的例子假設在一個虛構的企業中隻有兩個小組,每個小組隻有兩個組員。現在請各組的主管在一個5點的評分表上評價自己組裏兩位員工的表現(1分最低,5分最高)。這樣我們就有了4個分數。在這一組分數中,至少可以從3個角度來表現它們的方差(variance):

①每個員工的表現離開總平均多少?這個稱為總方差。②每個小組的平均值離開總平均多少?這個稱為組間方差(betweenvariance。③每個員工離開自己組的平均多少?這個稱為組內方差。因此,有總方差=[(5-3)2+(4-3)2+(2-3)2+(1-3)2]/4=(4+1+1+4)/4=2.5組間方差=[(4.5-3)2+(1.5-3)2]/2=(2.25+2.25)/2=2.25組內方差=[(5-4.5)2+(4-4.5)2+(2-1.5)2+(1-1.5)2]/4=0.25

故總方差=組間方差+組內方差13.1.1分拆方差協方差矩陣我們談過方差是可以分解為“組內方差”和“組間方差”的。那協方差也同樣可以分解嗎?答案是可以的。以下是一組假設的模擬數據,其中包括兩個變量:自變量x和因變量y。我們試試用這個數據來演算一次方差與協方差的分解。分組變量x變量y(x-x)2(y-y)2(x-x)(y-y)1124.841.602.791211.445.142.721543.240.541.321430.640.07-0.211231.440.070.322340.040.54-0.152134.840.070.592251.443.00-2.0827514.443.006.592533.240.07-0.483657.843.004.853211.445.142.723134.840.070.593440.640.540.593330.040.070.05總和50.4022.9320.20平均數3.23.273.361.531.35上麵有一組很簡單的數據。假設有3組員工,每組5人。每個員工都測量他們的滿意度(x)和工作表現(y)。滿意度的總平均是3.2;工作表現的總平均是3.27。上表的第四列是計算滿意度(x)的方差,第五列是計算表現(y)的方差,第六列是計算x與y的協方差。計算的結果是:x的方差是3.36,y的方差是1.53,x與y的協方差是1.35。現在來把這3組員工的數據分解開來,分別計算他們的組內和組間的方差與協方差。(1)(2)(3)(4)(5)(6)(7)(8)分組xyx.jy.j(x-x.j)2(y-y.j)2(x-x.j)(y-y.j)1123.240.361.081210.642.561.281544.841.963.08續表

(1)(2)(3)(4)(5)(6)(7)(8)分組xyx.jy.j(x-x.j)2(y-y.j)2(x-x.j)(y-y.j)1431.440.160.481232.82.60.640.16-0.322340.36002136.7612.62252.561-1.627511.5613.42533.641.961-1.43657.843.245.043211.444.842.643134.840.040.443440.640.640.643333.23.20.040.040.04SS0.320.9948.81817.4方差0.110.33在上表中,首先計算3組中每一組個別的x與y平均值。3組中x與y平均值分別為組一(x=2.8;y=2.6);組二(x=3.6;y=4.0);組三(x=3.2;y=3.2)。我們在第四列把這6個小組的平均值列出來。把3個x的小組平均值減去x的總平均(總平均=3.2,見前表)再求平方並加起來,就是上表的SS值。因為有3組,當求這3個小組平均的“組間方差”時,應該除以3。數學上“組間方差”(σ2b)的方程為σ2b=SSbJ=1J(x.j-x..)2(J是小組的數目)對於x來說,“組間方差”SSb=0.32/3=0.11;對於y來說,“組間方差”=0.99/3=0.33。對於協方差來說,“組間的協方差”=[(2.8-3.2)×(2.6-3.27)+(3.6-3.2)×(4.0-3.27)+(3.2-3.2)×(3.2-3.27)]/3=0.19。那“組內方差”是什麼呢?“組內方差”就是每一個員工的x與y值,減與自己小組的平均值[注:不是x與y的總平均值]所得差的平均平方和。我們在上表的第(6)列和第(7)列表示出來。例如,第(6)列的第一個數是(1-2.8)2;第六個數是(3-3.6)2等。同樣的,“組內協方差”就是[(x-x的小組平均)×(y-y的小組平均)]/15。在上表的第(8)列表示了組內協方差的計算。數學上“組間方差”(σ2w)的方程為σ2w=SSwK=1K(xij-x.j)2(K是總人數;xij是第i組的第j個員工)上麵的計算結果,是x的“組內方差”=3.25;y的“組內方差”=1.2;x與y的“組內方差”=1.16。我們把總方差協方差與組內、組間的方差和協方差列表如下:x方差y方差x與y協方差總樣本3.361.531.35組內3.2596.7%1.2078.4%1.1685.9%組間0.113.3%0.3321.6%0.1914.1%從上表我們可以清楚地看出,無論是方差或者是協方差,都可以分解成為“組內”和“組間”兩個部分。而“總方差”和“總協方差”一定等於“組內”和“組間”的方差,或是協方差的總和。明白了這個道理又怎麼樣呢?為什麼要花這麼多時間來研究方差、協方差是否可以分解成為“組內”和“組間”兩個部分呢?原因是管理學的數據往往是嵌套的。就用上麵的例子,當研究滿意度(x)和員工表現(y)的關係時,如果用的是總數據,分析的就是“總方差協方差”矩陣。但是數據是包括了兩個層階(小組和個人)的。用“總方差協方差”矩陣分析的結果同時包含了“小組的關係”和“個人的關係”在內。例如,當發現用“總方差協方差”矩陣分析,得到x與y的相關係數=0.5942時,到底這個關係是小組層麵導致的,還是個人層麵導致的呢?不把方差分拆,無從得知這個問題的答案。如果用(x減掉x的小組平均)和(y減掉y的小組平均)來做相關分析,得到的相關係數是0.5871。如果用x與y的3個小組平均值來做相關分析[注:這樣就隻有3個數據點],得到的相關係數是0.99!這代表“總方差協方差”矩陣的特征,在這個數據中,主要反映的是“組內”的方差協方差。“組間”的方差協方差所扮演的角色很少。其實,這個結果在上麵的方差總表就看出來了。x與y的協方差有85.9%是從組內來的,隻有14.1%從組間而來。上麵的把“總”方差協方差矩陣,分解成為“組間”方差協方差矩陣和“組內”方差協方差矩陣的總和,在多層次分析中,扮演著不可或缺的角色。讀者務必盡量明白當中的道理。因為在多層次分析中,常常會提到所謂的“組內”效應、“組間”效應等。其實,就是指不同的關係,到底有多少是因為組內的差異(由“組內”方差協方差矩陣代表)所產生的,有多少是因為組間的差異(由“組間”方差協方差矩陣代表)所產生的。13.1.2組間效應與組內效應現在我們有興趣了解什麼因素可以解釋“組間方差”和“組內方差”。

假設在每一個小組裏,影響員工表現的可能是員工的智能能力(GeneralMentalAbility,GMA)。智商越高的人,工作表現越好。而組與組之間的平均工作表現的差異,很有可能是主管的領導能力(leadership),故員工個人工作表現=a0+(a1×員工智力)+ε1(1)小組平均表現=b0+(b1×領導能力)+ε2(2)模式(1)是一個“個人層麵”的模型,因為自變量和因變量都是個人;模式(2)是一個“小組層麵”的模型,因為自變量和因變量都是小組。回歸分析可以分析模型(1)和模型(2),但是不可以“同時”分析這兩個模型。如果我們的理論認為“領導能力”不但會影響“小組平均表現”,也同時會影響“員工個人工作表現”,應該如何處理呢?如果更複雜一些,“領導能力”還會影響個體層麵的“員工能力”與“員工個人工作表現”時,又該如何處理呢?上麵的情況如果放入式(1)來看,也就是說每一組的a0與a1都不一樣。一般的回歸分析有一個假設,即a0與a1在整個樣本中都適用,整個樣本隻有一個截距a0和一個斜率a1。而現在的模型卻是:①第一組。領導A:員工表現=a01+(a11×員工智力)+ε1。②第二組。領導B:員工表現=a02+(a12×員工智力)+ε2。③a01,a11,a02,a12受“領導能力”的影響。這樣的模型是一般的回歸分析不能處理的。如果變量之間的關係全都是線性的關係,用數學來表達的模型可能為[注:根據HLM的習慣,用rij,u1j和u2j等符號來代表低層階與高層階的誤差,而不是用一般回歸分析的習慣,用ε來代表誤差]員工表現ij=a0j+(a1j×員工智力ij)+rij(rij是個人層麵誤差)a0j=b00+(b01×領導能力j)+u1j(u1j是小組層麵誤差)a1j=b10+(b11×領導能力j)+u2j(u2j也是小組層麵誤差)在這個模型中,員工表現ij是第j組的第i個員工的表現。同樣的,員工智力ij是第j組的第i個員工的智力。領導能力j是第j組領導的領導能力(因為每一組隻有一個領導,所以“領導能力”隻有一個下標j而沒有下標i)。在第j個小組裏,每個員工的表現受“員工智力”影響。影響的幅度包括了一個常數(截距a0j)和一個斜率(a1j)。這個截距和斜率每一組都不一樣,故a0j和a1j下麵才有下標j(代表是第j組的a0和a1)。而不同組的a0j和a1j就受這一組的“領導能力”影響。因此,每一組內的某一個員工的表現(yij)受4個變量影響:這一組的截距(a0j),即“員工智力”為0時員工的表現。這一組的斜率(a1j),即“員工智力”對“員工表現”的影響。這一位員工的“智力”(xij)。一個低層階(個人層麵)的隨機誤差(rij)。影響“員工表現”yij(放大了的圓點)的4個影響因素:

①整個樣本隻有一條回歸線。yij隨“員工智力”(xij)的變化而變化(回歸直線),x與y的關係是不變的。yij離開回歸線的部分是隨機誤差rij。②在每一小組裏,yij除了隨xij變化而變化,也會隨著不同小組的截距而改變(因為a0j)。③每一個小組的回歸線都有不同的截距和斜率,故yij不但隨著不同小組的截距(a0j)而改變,yij與xij的關係也會隨著各自小組不同的斜率(a1j)而改變。傳統的單層的回歸分析隻可以處理兩個影響因素(xij的影響和隨機誤差rij)。當每一組的截距和斜率都受著第二層的“領導能力”的影響時,傳統的“一層”的回歸分析就束手無策了。這時,就要用到“多層線性模型”了。13.2HLM應用範例13.2.1實際的“多層線性模型”的例子在組織行為學的研究中有很多跨層麵的課題。例如,員工個人的“組織公民行為(OrganizationalCitizenshipBehavior)”可能受員工個人的“工作滿意度(JobSatisfaction)”和領導的“變革型的領導行為(TransformationalLeadership)”影響。這裏,因變量“組織公民行為”是個人層麵的變量,自變量“工作滿意度”也是個人層麵的變量。但是另一個自變量“改革型領導行為”卻是一個小組層麵的變量,因為每一個領導隻有一個水平的“改革型領導行為”,不會因小組內不同組員而變化。