3)總體指標模型(Globalmodel)總體指標模型很簡單,即通過外部觀察者、主管評價、顧客評價或者客觀數據等直接對總體進行測量。例如,團隊績效、團隊成立時間、團隊創造力等。測量時的評價對象為團隊總體,因為不是由團隊成員進行評價的,所以不需要成員意見一致。評價測量工具時,需要提供個體層麵測量的信度效度。
4)共同一致模型(Consensusmodel/Pooledconstrainedmodel)有的高層麵構念在定義時就包含了“成員共同的/共享的……”的含義,例如,文化如果被定義為成員共同的理念、行為、態度、價值觀等,這時文化的定義本身包含了共享的部分,因此如果沒有這一部分,構念本身就是不成立的。團隊氛圍(teamclimate)、團隊規範(teamnorm)等構念也有類似的性質。因此,在這一類測量中,數據的來源是個體,每個個體針對自己進行評價。但高層麵構念是通過個體的彙總計算得到的,並且彙總的前提是大家能夠達到一定程度的一致。評價測量工具時,需要提供團隊層麵的信度效度。
5)參照轉移模型(Referentshiftmodel)參照轉移模型是由團隊成員對一個共同的事物做出評價,而不是像前麵的共同一致模型那樣報告自己的情況。例如,請每位成員對一位領導進行評價,或是評價他們所感受到的整個團隊的合作氛圍。在這裏,個體隻是一個信息的來源,他們評價的對象已經不是答題者自己了,也就是說參照物變了,故我們稱為參照轉移模型。因為是由多個人對一個事物進行評價,我們會認為大家一致的部分可以相對準確地代表這個事物的客觀水平,所以最後的團隊層麵的測量是用所有人數據的平均值代表的。但因為我們假設大家不同的部分是因為個人觀點差異引起的誤差,所以需要大家觀點的一致程度達到一定標準才能夠加總。評價測量工具時,需要提供團隊層麵的信度效度。
6)分散度模型/結構指標模型(Dispersionmodel/Configuralmodel)如果你關心的是一個團隊中個體特征的分散度,這時需要用到結構指標模型。結構指標模型所測量出的團隊層麵的構念描述的是個體數據分布的“結構特征”。
例如,一個團隊中每一位成員與領導的關係存在多大程度的差異,這就需要用一個結構指標模型來表示。我們前麵介紹過的表示數據分散度的指標都可以用作每一個團隊分散度的測量,如標準差、方差、極差等。因此,我們需要個體提供信息,並對自己進行評價,然後基於個體的數據計算團隊層麵的分散度。由於分散度本身就是這裏需要的變量,因此計算時不需要團隊成員一致作為條件。評價測量工具時,需要提供團隊層麵的信度效度。在理解了以上幾種類型的高層構念後,讀者也可以參考Chan(1998)的文章,這篇文章把高層構念的類型分為3種,分別命名為相加構成模型(Additivecompositionmodel)、直接一致模型(Directconsensusmodel)和參照轉移模型(Referenceshiftmodel)。其實,把這些構念命名成什麼不重要,重要的是研究者自己要清楚自己的構念是什麼性質的,以及可以用什麼相應的方式測量。讀者可能已經注意到,前麵介紹的6種模型中有4種模型是不需要有團隊成員的意見一致作為基礎的,而另外兩種模型是需要有團隊成員的意見一致作為基礎的。其實隻要你清楚這背後的理論原因,就很容易判斷了。在選擇分數模型、歸納指標模型、總體指標模型和分散度模型中,我們所關心的高層麵構念的存在意義是不會受低層麵的方差大小影響的,並不會因為方差太大或太小,高層麵的構念就變得沒有意義了。以歸納指標模型為例,研究者需要把整條生產線每個員工的個人產值加起來得到“生產線的總產值”。
在這個加總的過程中,同一生產線上員工個人生產值的方差(變異數)有多大完全不影響“生產線的總產值”的計算,因為無論方差多大,我們總是能夠通過加總的方式得到總產值。但是,在共同一致模型和參照轉移模型中,低層麵方差的大小卻會直接影響高層麵構念是否有存在的意義。因為這兩種模型中,我們都是假設大家的意見中有共同的部分,或者評價的是同一個客觀事物,所以如果大家彼此之間差異很大,那這個共同的部分是否存在就成了一個需要質疑的問題。如果一個企業隻有4個員工,員工甲的程序公平評分是1分(假設評分是在一個7分的量表上,1分最低,7分最高),員工乙的程序公平評分是7分,員工丙的程序公平評分是1分,而員工丁的程序公平評分是7分。當個人層麵評分有這麼大的方差時,我們就很難說這個企業的平均程序公平評分是4分了。因此在“直接一致模型”裏,“低層麵構念”有一定程度的一致是必需的。到底什麼稱為有一定程度的一致性呢?組織行為研究一般用Rwg和ICC來代表。這個問題我們將在12.3中詳細討論。大多數時候,一個構念的定義決定了它隻能采用某種模型進行測量,例如,年齡的分散度,就隻能用分散度模型。但有的時候,一個高層麵的構念可以用不同的模型來測量,這時候應該如何選擇呢?對於這個問題,我們有幾個一般性的建議供大家參考。第一,如果可能,盡量在高層麵直接測量,而避免用個體數據加總的方式進行測量。例如,團隊業績這個構念,可以選擇用公司的業績數據記錄,也可以由團隊成員對團隊業績進行評價再加總。如果能夠獲得公司的團隊業績記錄,當然優先考慮用這個客觀指標來測量。第二,需要考慮誰能夠提供更為準確的信息。例如,測量“領導風格”這個構念,可以由每位團隊成員對其領導進行評價再取平均,也可以由領導自己彙報自己的行為,哪一種更有可能反映實際情況呢?那自然是團隊成員的評價比領導自己的評價準確。12.3“低層麵”到“高層麵”加總的一致性在前麵討論的共同一致模型和參照轉移模型中,都涉及一個關鍵的問題——成員意見的一致性,因為它直接影響到我們所測量的高層構念是否有意義。而現實中,成員的意見不可能完全相同,那麼成員的意見要一致到什麼程度才是合理的,才能夠彙總呢?例如,我們請每位團隊成員對整個團隊的合作性(cooperativeness)作一個評價,然後用大家的平均來代表團隊的總體合作性(groupcooperativeness)。如果少數團隊成員報告的分數特別低,而其他成員報告的分數都非常高,我們可以用成員的平均分數作為整個團隊的測量,認為它是一個高合作性的團隊嗎?到底低層麵變量的方差在什麼程度範圍內,把低層麵變量加總成為高層麵變量才算合理呢?這一節介紹兩個通用的指標:Rwg,ICC。在做研究的過程中,這兩個指標可以幫助我們判斷低層麵變量的方差是否在合理的範圍內。12.3.1組內評分者信度為了判定低層麵變量在加總前的一致性問題,James等(1981)提出了Rwg(withingroupinterraterreliability,Rwg)的概念。這個概念很簡單,但是卻設計得很巧妙:找到所有成員最不一致的那種情況,然後用實際測量的情況與之相比。越相近,說明大家越不一致,越不相近,說明大家越一致。那麼,最不一致的是什麼情況呢?當然是大家的評分完全隨機分散在各個選項的時候了。用統計的語言說,Rwg的邏輯就是把實際觀察的“低層麵變量的方差”與想象中最不一致的情況(也就是隨機分布的方差)作比較,以此來決定把低層麵變量加總到高層麵的合理性。“隨機分布的方差”是什麼意思呢?如果組內成員的評分是隨機的,也就是說他們是隨意評分,那麼評分自然就不會一致了。如果實際觀察到的低層麵變量的方差幾乎等於隨機分布的方差,就代表變量的隨機性很高,也就是評分者的一致性很低。相反,如果要加總的變量的方差遠遠少於一個隨機分布的方差,就代表變量的隨機性很低,也就是說評分者的一致性很高。下麵我們用一個例子來說明這個概念。我們假設要加總的變量是工作滿意度。研究人員想把“個別員工的工作滿意度”加總起來,變成“團隊的工作滿意度”。
這時,k個團隊成員對他們的工作滿意度的評分都是一樣的4分,那麼,這個變量的方差就等於零(σ2x=0)。在這種情況下,顯而易見,團隊成員的一致性非常高。
但是,讓我們看一個完全相反的情形。如果每一個團隊成員的評分都完全不一樣的話(即團隊成員的評分是非常分散的,完全不一致),假設我們有無限個團隊成員,那最後的分布應該是一個長方形分布(也就是成員選取1,2,3,4,5的機會應該是完全一樣的。在這種情形下,每個分數上的頻數都是一樣,數據的分布可以視為一個長方形的分布,這時,我們觀察到的方差是所有可能的方差中最大的。我們上麵所說的是很極端的兩種情況。在一般的情形下,研究人員觀察到的方差應該是介乎0(完全一致)與最大誤差(完全隨機)之間。
從概念上看,Rwg就是“變量的真實觀察方差”與“理論的隨機最大方差”的比例。“變量的真實觀察方差”越小於“理論的隨機最大方差”,也就是越接近“理論的一致最小方差”(σ2x=0),就說明團隊評分的一致性越高。從數學上看,有公式為Rwg=σ2EU-σ2xσ2EU=1-σ2xσ2EU式中,σ2EU是隨機分布的方差,也就是可能的最大方差。σ2x是實際觀察到的評分方差。如果σ2EU與σ2x差不多,就代表“實際評分方差”跟“隨機最大方差”差不多,Rwg就會接近0。相反,如果“實際評分方差”(σ2x)差不多等於0,就代表團隊評分的一致性極大,隨機性幾乎等於0,這時候Rwg就會接近1。因此,Rwg是在0到1之間變化的。如果數據是用李克特等級(Likerttypescale)來評分的話,James等(1981)也提供了隨機分布(長方形分布)的最大方差公式,即σ2EU=A2-112A是評分量表的點數;A=5代表是5點的量表因此,如果研究者用5級量表來測量,那麼所有團隊成員最大可能的方差應該是(52-1)/12=2.0;如果用的是7級量表,那麼所有團隊成員最大可能的方差應該是(72-1)/12=4.0。我們來看一個例子。一個團隊裏有10個成員,在回答“這個團隊裏的成員常常互相幫助”(5點量表)這道題時,這10個成員的評分分別是5,2,3,5,2,3,4,1,3,4。團隊的平均值是3.2。但是這個平均值有意義嗎?它能夠代表這個團隊裏大家互相幫助的行為嗎?我們首先需要用Rwg的公式來討論成員的意見是否一致。讀者很容易計算出,σ2x=1.73;σ2EU=2.0;Rwg=0.13。那Rwg=0.13代表一致性有多高呢?James等的建議是Rwg大於0.70,說明一致性達到可以接受的標準。用這個標準,上麵10個成員的評分是非常不一致了,這時就不能用平均分的方式測量團隊中的互助行為。但是,如果這10個程員的評分是4,3,3,4,3,4,3,3,4,4的話,可以計算出,σ2x=0.28;σ2EU=2.0;Rwg=0.86;這時,10個成員的評分就非常一致了,可以用平均分作為團隊構念的測量。LeBreton和Senter(2008)在重新考慮Rwg這個概念時,提出了以下參考:當Rwg為0~0.3時,代表組內沒有一致性;0.31
0.90時,組內一致性為極高。理解了上麵最簡單的Rwg公式,我們再做一些擴展。前麵的例子是假設量表隻有一個題目,但實際研究中,我們用的很多量表都包含多個題目。James等推導了一條多題目量表的Rwg公式,稱為Rwg(J),即Rwg(J)=J[1-σ2xj/σ2EU]J[1-(σ2xj/σ2EU)]+[σ2xj/σ2EU]現在因為量表有多於一個題目(J是題目的數量),而每一個題目都有觀察的方差(第j道題的方差是σ2xj),所以要把所有題目的觀察方差平均(σ2xj),然後才計算Rwg(J)。測量“團隊成員互助行為”的6個題目J=6;k=10題目1題目2題目3題目4題目5題目6平均評分者15321253.0024442433.5035553143.8344331322.6755223232.8364432153.1775341423.1784211222.0095324133.00評分者104544544.33平均4.53.432.22.53.3σ2xj0.281.161.561.512.061.341.32Rwg(J)=6[1-(1.32/2)]6[1-(1.32/2)]+[1.32/2]=0.76James等(1981)在提出前麵的計算公式時,都是假設了團隊成員的評分完全不一致的時候,研究人員觀察到的分布是一個長方形分布,即在一個5級量表中5個答案(1,2,3,4,5)的機會是均等的。但是實際情況是,即使大家對於被評價的事物沒有一個共同的看法,也不代表觀察到的分布是長方形的。例如,一般人麵對5級量表就很少會選極端的答案,所以1和5這兩個選擇的機會一般比較低,2和4可能高一點,而機會最大的應該是3。因此,James等就提出了另外一個可能的理論隨機分布——三角形的分布。
在這三角形分布中,5個等級的概率分別是p(1)=0.11;p(2)=0.22;p(3)=0.33;p(4)=0.22;p(1)=0.11。對應於這樣一個三角形的理論隨機分布,它的方差為σ2EU=(A-1)(A+3)/24當A是單數時
(A2+2A-2)/24當A是雙數時當A=5時,三角形的理論隨機分布的方差σ2EU=32/24=1.33(長方分布的方差是2.0)。測量“團隊成員互助行為”的6個題目J=6;k=10題目1題目2題目3題目4題目5題目6平均評分者15321253.0024442433.5035553143.8344331322.6755223232.8364432153.1775341423.1784211222.0095324133.00評分者104544544.33平均4.53.432.22.53.3σ2xj0.281.161.561.512.061.341.32Rwg(J)=6[1-(1.32/1.33)]6[1-(1.32/1.33)]+[1.32/1.33]=0.04我們對關於Rwg的幾個要點做一個總結:①在使用Rwg到團隊評分時,每一個團隊都會有一個Rwg值。因此,如果數據中有20個組的話,就會有20個Rwg值。②一般來說,使用Rwg時會觀察兩個指標:a.各小組的Rwg值的中位數一定要很高。George和Bettenhausen(1990)指出Rwg中位數大於0.70就代表團隊評分的一致性頗高。一般在彙報時,最好可以報告所有小組Rwg的最大值、最小值、中位數和平均數。b.有些研究者建議凡是Rwg少於0.70的小組數據都應該刪掉。不過,也有人建議當小組的Rwg超過0.70的百分比很高時(如90%),整個數據就可以保留。
③理論上,Rwg應該是介乎於0與1之間。因為“隨機方差”應該是理論上最大的隨機方差。但是在實際運算時,Rwg有可能是負數或是大於1.0。這也是Rwg的一個很大的弱點。一般大於1的我們就當成1,小於0的就當成0。④既然James等(1981)提出了長方形和三角形隨機分布,研究者怎樣知道哪一個才對呢?我們的經驗是很多期刊評審員都覺得Rwg是一個很寬鬆的指標。一般的數據很容易就可以達到Rwg中位數超過0.70的要求。因此,我們不妨在選取隨機分布的時候嚴謹一點。從這個角度來看,在一般情形下,長方形隨機分布可能比較合適。12.3.2組內相關係數除了Rwg外,最常用的評分一致性的指標就是“組內相關係數(Intraclasscorrelation,ICC)”。
ICC所用的概念其實與方差分析(AnalysisofVariance,ANOVA)很相近——如果小組內的平均方差(withingroupvariance)遠遠小於組與組之間的方差(betweengroupvariance),就表示小組內的評分頗為一致。相反,如果“組內組員的方差”比“組之間的平均方差”還大,那就很難說小組內的評分一致了。從概念就可以看出,ICC與Rwg有一個很重要的分別。在用Rwg值驗證小組內評分的一致性時,每一個小組都有一個Rwg值。如果樣本裏有10個小組,就有10個Rwg值。但是用ICC來判斷組內一致性時,在一個樣本裏,隻有一個ICC值。
現在舉一個例子來解釋ICC是什麼。假設有J個小組,每個小組有K個組員,用一個李克特等級(Likerttypescale)量表來評自己所在團隊的“團隊成員互助行為”的分數。我們的問題是這J個小組的每個小組內,K個組員的“團隊成員互助行為”評分是否一致。如果一致的話,我們就可以拿一個團隊中K個組員的平均值來代表這個團隊的“團隊成員互助行為”分數。如果評分不一致,用平均分數作為團隊分數就有問題。但是,如何知道組內的組員評分是否一致呢?用方差分析的概念我們可以比較“組內組員的方差”和“組之間的平均方差”。
是我們用不同深淺顏色表示5組。每一個長方形是一個組員。凡是同一個縱軸的長方形,就代表同一組的組員。每組中間的圓是該組的小組平均值。“組內方差”(σ2w)就是同一組(同一個縱軸的長方形)相對於自己組的平均(圓形)的方差。“組間方差”(σ2b)就是不同組的平均(圓形)之間的方差。