丟丟學過了如何用因子分析評價構念測量的信度效度,以及回歸分析和統計假設驗證後,他知道自己已經可以開始做一點簡單的研究了。他繼續思考自己關於GDP與幸福感的研究,他發現可能自己當初想象得太簡單了,經過仔細思考和文獻分析後,他發現至少有這樣幾個機製解釋GDP對人們的影響,GDP可能提高了商品的豐富程度和人們的平均收入,在這個方麵可能提高了物質滿足感,但是在GDP提高的同時,犧牲了自然環境和資源,讓人們變得忙碌而忽視了親情友情的聯係,增加了生活壓力,找不到生活的方向……這些方麵又降低了人們的生活意義感。看來要用幾個不同方麵的構念才能反映出人們生活的感受。這裏,丟丟想到了至少有物質滿足感和生活意義感兩個構念。可是丟丟以前隻會使用回歸的方法檢驗幾個自變量對一個因變量的影響,現在他想檢驗一個自變量通過幾個不同的路徑對兩個因變量產生影響,這樣複雜的模型要如何檢驗呀。丟丟把自己的困惑給李老師說了。李老師似乎早就猜到了丟丟會遇到這樣的問題。笑著回答道:“丟丟,這個問題不難解決。”
丟丟:“可是我從來沒有見過如何在一個回歸方程中放進多個因變量啊……”李老師:“如果我們聯立多個回歸方程,不是就可以估計多個因變量了嗎?中學時學習的多元方程組就是這個原理。現在我們用類似的方法來估計模型中的參數,這個方法稱為結構方程模型。”
丟丟:“結構方程模型。聽起來好高深啊……”李老師:“等我給你講完原理以後,你就會覺得一點都不難了。很高興你每一次都是因為解決一個問題想要去學習新的東西。這些研究方法都隻是工具而已,是為我們的問題服務的。有一天也許你發現你的研究問題沒有合適的工具來解決,那你就可以自己創新一個方法,目的隻有一個,解決你的研究問題。”
丟丟:“明白了,李老師,我不會讓自己變成方法的奴隸的。既然結構方程模型不難,我現在就向您學,好嗎?”
11.1問題的出現
例子一
在研究的過程中,我們往往會接觸一些很複雜的關係,是一般的回歸分析和多元回歸分析不能解決的。例如,我們研究的問題可能是:什麼因素會導致員工做出工作以外的額外對企業有益的行為(組織公民行為,OCB,如幫助同事、鼓勵同事等)?我們建立的理論模型可能是基於“認同理論(identificationtheory)”,員工一定要對企業、主管和同事認同,才會有公民行為。因此,員工覺得自己所在的企業是一家很棒的企業(企業認同),覺得自己能以身為現在的主管的下屬為榮(主管認同),以及覺得自己跟現有的同事非常合拍(同事認同)就是公民行為的三大前因。
顯然回歸分析就是這個模型的一個很自然的分析工具。數學上我們把以上的關係寫為公民行為=β1企業認同+β2主管認同+β3同事認同+ε[注意:假設所有變量都是標準化,方差為1.0。]如果模型較複雜一點,同時考慮認同對份內表現(inroleperformance)和公民行為(OCB)的影響。因為有兩個因變量不可以用簡單的多元回歸分析,需要轉為多變量回歸分析(multivariateregression)。數學上把以上的關係寫為份內表現=β1企業認同+β2主管認同+β3同事認同+ε1
公民行為=β4企業認同+β5主管認同+β6同事認同+ε2[注意:多變量回歸分析(multivariateregression)與多元回歸分析(multipleregression)不同。前者牽涉在回歸過程“同時估計多個因變量”。
後者隻是“有多個自變量,因變量還是一個”的回歸分析。本書回歸分析一章沒有介紹多變量回歸分析,原因有二:比較複雜,在管理研究中出現的機會不太多。]但是,如果模型更複雜一點,包含了公民行為的多階段前因,一般的回歸分析就不能解決問題了。例如,不同類型的認同可能會在不同的階段影響公民行為。員工首先要對企業產生認同。然後,對企業的認同會影響員工對主管和同事的認同。最後,3種不同的認同會同時影響員工的公民行為。這個模型牽涉了3個不同的因變量(企業認同、主管認同和同事認同),如果用數學公式表現,應該有3個回歸分析,即主管認同=β1企業認同+ε1同事認同=β2企業認同+ε2公民行為=β3企業認同+β4主管認同+β5同事認同+ε3以上3條回歸分析的參數本來可以分開3次來估計,但是這樣卻達不到我們模型中3個公式是同時進行的假設。因為“企業認同”除了自己對“公民行為”有直接影響外,還會通過“主管認同”和“同事認同”來影響它。因此,一個好的估計方法是把3個公式的所有參數同時估計出來。“結構方程建模”就是一個幫助我們達成這個目的的工具。上麵的3條方程反映了構念之間的關係,所以它們是有“結構”的“方程”。
因為我們是用它們來建立我們的模型的,故稱為“建模”。
這就是“結構方程建模”這個詞的意思。例子二另外一個“結構方程建模”常用的情形就是:檢驗看不見的構念與看得見的測量項目之間的關係。例如,我們可能用兩個項目來測量“主管認同”(稱為x1和x2),另外兩個項目來測量“同事認同”(稱為x3和x4)。為了方便起見,我們將“主管認同”稱為ξ1,將“同事認同”稱為ξ2,而這兩個看不見的構念的相關是12(ξ這個希臘字母讀音是ksi,的讀音是phi)。在問卷中,這4個項目分別為:構念測量項目評分主管認同1.我以能夠在這企業工作為榮123452.我常常在別人麵前提到我企業的好處12345同事認同3.我的同事都是很棒的人123454.我常常以我的同事為榮12345如果用congenericmeasurementmodel來表示兩個構念與它們的測量項目之間的關係。
x1=λ11主管認同+ε1x2=λ21主管認同+ε2x3=λ32同事認同+ε3x4=λ42同事認同+ε4以上4個公式本來可以分開4次來估計,但是一個更好的估計方法是把當中所有的參數(λ11,λ21,λ32,λ42,σ2ε1,σ2ε2,σ2ε3,σ2ε4,12)同時估計出來。而“結構方程建模”就是一個幫助我們達成這個目的的工具。
11.2探索性因子分析和驗證性因子分析
例子二中講的測量模型正確的名稱為“驗證性因子分析”。
驗證性因子分析其實是結構方程建模其中一種模型,我們也稱為測量模型(也就是表現看不見的構念和看得見的測量項目的關係的一種模型)。在闡明什麼稱為“驗證性的因子分析”的時候,把它和“探索性因子分析”一同比較可能更容易理解。讓我們還是用“主管認同”和“同事認同”的4個項目作為例子。構念測量項目評分主管認同1.我以能夠在這企業工作為榮123452.我常常在別人麵前提到我企業的好處12345同事認同3.我的同事都是很棒的人123454.我常常以我的同事為榮12345我們在上幾章中談過所謂的“因子”,其實是一組變量的一個線性組合。所以x1,x2,x3和x4這4個變量兩個因子ξ1(代表主管認同)和ξ2(代表同事認同)可能為ξ1=w11x1+w21x2+w31x3+w41x4
ξ2=w12x1+w22x2+w32x3+w42x4在因子分析的一章中已經談過了,變量也可以寫成由因子組成的一個線性函數。故我們可寫為(稱為方程組A)x1=λ11ξ1+λ12ξ2+ε1
x2=λ21ξ1+λ22ξ2+ε2(λjk是變量j在因子k的因子的載荷)x3=λ31ξ1+λ32ξ2+ε3
x4=λ41ξ1+λ42ξ2+ε4在因子分析的一章中已經解釋過,為什麼因子寫成變量的方程中是沒有誤差的。因為因子的“定義”,就是變量的一個線性組合。這就等於建立一個新的變量y,把y定義成為y=x+5一樣,沒有加上誤差項的必要。但是,當變量(x)寫成因子(ξ)的函數時,因為隻用了兩個因子來代表4個變量,其中有信息減少了,兩個因子是沒有能力完全代表4個變量的,當中一定存在誤差,所以就有加上誤差項(ε)的必要。在這裏假設誤差項是正態分布的,均值為0,方差為σ2ε,故ε~N(0,σ2ε)我們將方程組A稱為“探索性因子分析(ExploratoryFactorAnalysis,EFA)”。
因為在方程組A裏,我們模擬項目變量和它們背後的構念的時候沒有預設“哪個項目對應哪個構念”的關係。所以4個項目變量x1,x2,x3和x4在兩個因子(ξ1和ξ2)上都有載荷(factorloading)。我們首先進行了因子分析,把載荷估計出來,然後基於載荷(λ11,λ21,λ31,λ41,λ12,λ22,λ32,λ42)來“探索”項目(x1,x2,x3和x4)和它們背後所代表的構念(ξ1和ξ2)的關係。我們的期望是λ31,λ41,λ12,λ22都很小。這代表了項目x1和x2真的是在測量同一個構念,而x3和x4也真的是在測量另外一個構念。相對來講,還可用另外一種方法來模擬項目變量和它們背後的構念關係。因為項目x1和x2都是用來測量“主管認同”的,而項目x3和x4是用來測量“同事認同”的,所以第一個因子(ξ1)應該是“主管認同”。
它主要是反映了x1和x2,λ21和λ22應該很小,差不多等於0。同樣,第二個因子(ξ2)應該是“同事認同”。
它主要是反映了x3和x4,λ31和λ41應該差不多等於0。因此,上麵一組方程可以簡化為(稱方程組B)x1=λ11ξ1+ε1
x2=λ21ξ1+ε2
x3=λ32ξ2+ε3
x4=λ42ξ2+ε4
我們將方程組B稱為“驗證性因子分析(ConfirmatoryFactorAnalysis,CFA)”。
因為在方程組B中,我們清楚地模擬項目變量和它們背後的構念的“項目與對應構念”間的關係。所以x1和x2隻會在ξ1上有載荷;同樣,x3和x4隻會在ξ2上有載荷。在進行因子分析參數估計的時候已經描述了構念和項目參數的理論關係。現在,我們隻是要“檢驗”這個理論關係和數據是否吻合而已。驗證性因子分析與探索性因子分析最大的分別是驗證性因子分析不允許交叉載荷(nocrossloading)。自然驗證性因子分析也和探索性因子分析一樣,不允許兩個隨機誤差(εj和εk)之間有任何的相關(nocorrelatederrors)。x1=λ11ξ1+ε1
x2=λ21ξ1+ε2
x3=λ32ξ2+λ31ξ1+ε3
x4=λ42ξ2+ε4
不允許交叉載荷的意思是:測量一個構念的項目變量是不允許在其他構念上有載荷的。例如,在驗證性因子分析中,我們的目的是驗證x1和x2確實在測量ξ1;x3和x4確實在測量ξ2。因為x3是用來測量構念ξ2的項目變量,而λ31是該項目變量在構念ξ1的載荷,所以是不允許的。不然的話,x3這個項目就是在同時測量ξ1和ξ2,那就不是一個純正的測量項了。同時,隨機誤差ε1和ε2或者是ε2和ε4也不允許有任何的相關。為什麼ε1和ε2不可以有任何相關呢?因為在這個驗證性因子分析中,影響x1和x2的隻有ξ1一個構念。剩下的就是ξ1和ξ2兩個隨機的變量。換句話說,x1和x2所有的相關都是源於ξ1。因此,在x1和x2的方差中,不能由ξ1解釋的方差部分必然是隨機的誤差。但是讀者可以想一下,如果ξ1和ξ2相關,就代表除了ξ1以外,還有一些不明(不在我們的模型中)的構念在同時影響x1和x2。正因為這個原因,ξ1才沒有能力解釋x1和x2的所有係統的相關。因此,允許ξ1和ξ2兩個隨機項相關,就代表這個測量模型有問題。x1和x2不隻是測量ξ1這個構念。為什麼ξ2和ξ3不可以有任何相關呢?其實原因也是一樣。根據我們的模型,x2和x3一點關係都沒有。如果它們有關係的話,隻是因為x2在測量ξ1,x3在測量ξ2,而ξ1和ξ2相關(12)。與上麵的道理相同,如果ξ2和ξ3相關的話,就代表“x2隻是在測量ξ1;x3隻是在測量ξ2”這樣一個測量模型是不對的。因為應該存在著一個不明(不在我們的模型中)的構念在同時影響x1和x2。