這裏,~X表示X不發生。前麵是有了X就一定有Y;後麵是沒有X就一定沒有Y。可是我們會發現,在自然科學和社會現象中幾乎沒有現象可以完全滿足這個條件。因此,概率因果關係就放寬了一點條件,隻是要求X的發生提高了Y發生的可能性。用概率式也可以表示為,當P(Y|X)>(P(Y|~X)
時,我們就認為“X影響了Y”。
這個不等式的意思是“有了X就有Y的可能性,是大於沒有X就有Y的可能性”。
舉個例子,一個人“憤怒的時候(X)就會發脾氣(Y)”,比一個人“不憤怒的時候(~X)就會發脾氣(Y)”為高,這樣憤怒就是發脾氣的原因了。這樣放寬的條件使得共變的條件更實用了。但相關本身仍然是不可以說明有因果關係的,因此PatrickSuppes又增加了一個條件,即X與Y不能有共同的原因。用上麵的例子,憤怒(X)與發脾氣(Y)可能有一個共同的原因,就是看見“不公平的事情”(C)。所以嚴格來說,不是憤怒讓人發脾氣,而是看見不公平的事物時,同時引致憤怒和發脾氣。因此有一些研究設計中需要排除X與Y有共同原因的可能性。
[注:下標0,1,2表示時間性,時間的順序是0最早,接著是1,然後到2。]有關事物之間的因果關係以及各種不同類型的原因,還有很多哲學家提出過不同的觀點,我們在這裏就不詳細討論了。目前,管理學研究中的方法基本上是在休謨的觀點上發展出的概率因果關係。傳統意義上,我們所說的充分原因(充分條件)、必要原因(必要條件)等都是指兩個事物之間嚴格的關係。如果X是Y的充分原因,那麼隻要X發生,Y就必須發生;如果X是Y的必要原因,那麼隻要看到Y發生了,就可以推斷X一定發生了。但是,如果按這樣嚴格的標準,對於很多事物我們都不能通過研究找出它們的必要原因和充分原因了。出於對研究的可操作性的考慮,很多學者都接受了概率因果關係的觀點。X與Y之間存在概率因果關係的意思是,X的發生會增加Y發生的概率。對於這種觀點的普及,你可以用兩種方式理解:一種理解是我們人類的認知能力是有限的,很難通過研究活動,去建立對於一個絕對意義上的因果關係體係來解釋世界。因此,概率因果關係是退而求其次的方法。另一種理解是事件按一定概率發生本來就是規律本身的屬性之一,而不是由於人認知能力限製。這是哲學的基本假設問題,不好說哪一個是對的,哪一個是錯的,甚至是可能兩個都對,或者是兩個都錯。讀者可以按自己的經驗和領會自行決定。
9.1.2簡單因果模型的檢驗
我們前麵討論測量時說過,一個構念需要用可觀察的指標來進行測量。同樣道理,理論上的因果關係模型又應該用什麼樣相應的數據來檢驗呢?結合休謨提出的因果關係3個條件以及概率因果關係的觀點,不難看出,如果我們在理論上提出X與Y之間的因果關係,我們必須能夠對這個因果關係的機製有一個很有說服力的解釋,這是最重要的。其次,如果這個理論是對的,我們應該可以在數據上觀察到下麵這些現象:第一,X總是發生在Y之前。第二,X與Y的變化在較高的概率上是相關的。第三,X與Y的共同變化不是由於其他因素對X和Y的共同影響導致的。為了獲得這些證據,我們有不同的研究方法可以選擇,在管理學中我們常用的包括實驗、調研、定性研究等。其中,從檢驗因果關係來看,最理想的是實驗法,它的優點在於可以控製其他無關因素,並且操控(manipulate)X的變化,來觀察Y的變化,因此很大程度可以滿足上麵的幾個條件。但實驗有它的局限,實驗室中的設計使得研究結論可能不能夠擴展到真實的工作場所。而且對於那些無法在短時間內操縱改變的X,就很難用實驗設計來研究了。另一種方法是定性調研,它對於深入地探索既有理論不能夠解釋的新現象,發展理論來解釋事物之間的因果關係也能夠發揮很大作用。這兩種方法都有大量的參考資料,我們在這本書中就不展開討論了。
在這裏我們主要介紹的是用調研的方法來檢驗因果關係。用調研的方法實際上是通過檢驗X與Y之間在數據上的相關關係來檢驗上麵的第三個條件,X和Y在多大的概率上是相關的。所以我們看到,相關關係的檢驗僅僅提供了對因果關係中一個條件的支持。但需要注意的是“X與Y相關”僅僅是“X是Y的原因”的必要而非充分條件。所以我們永遠不能僅僅從一個相關關係倒推出一個因果關係,否則輕則鬧出很多笑話,重則提出一個錯誤的研究結論。例如,我們對6~18歲的學生的手臂粗細程度和數學能力做了統計分析,發現手臂粗細和數學能力成正相關關係,於是就提出手臂粗細是影響數學能力的重要原因,這樣可以嗎?讀者不要笑,很多文章都是用這樣的邏輯寫成的,尤其是那些先收了數據,然後根據數據結果來寫故事的研究正是用的這樣的方法。也正是因為它們貌似有理卻帶來了虛假的知識,所以我們是非常反對這樣做研究的。也正是由於調研方法中存在虛假相關的可能性,因此,現在對於調研方法的要求越來越高,需要盡可能多地提供其他方麵的證據支持。除了對理論基礎的要求,在研究設計上也有一些可以注意的地方。例如,為了滿足第一個條件,最好能夠把自變量X和因變量Y分兩個時間點測量,並且在第一個時間點時控製因變量Y的初始值,而且時間間隔應該是理論上自變量影響因變量所需要的時間。這裏補充幾個概念,如果一個研究是在同一個時間收集所有的數據,則稱為橫截麵調研(crosssectionalstudy),如果分不同的時間點收集數據,則稱為時間差調研(timelagstudy),如果有3個以上的時間點重複測量同樣的變量來檢測其變化,則稱為縱向調研(longitudinalstudy)。我們這裏所說的就是時間差調研的設計。例如,如果我要研究組織提供的新員工引導策略是否會影響新員工對工作技能的掌握,那麼需要先從理論上清楚新員工工作技能變化的過程大概需要多長時間,然後以這個時間段為間隔,在前後分別測量新員工對於工作技能的掌握水平。為了滿足因果關係的第三個條件,需要在理論上充分討論是否有可能有一個共同的因素C影響X和Y,如果實在不能排除C的影響,就需要考慮如何在數據分析時除去C的影響。例如,過去的很多調研所有變量都是由同一個答題者來回答的,這時觀察到的X與Y之間的關係中可能有很大一部分並不是X和Y的真實關係,而僅僅是由於同一個答題者回答問題所帶來的,這種誤差我們稱為同源方法誤差(commonmethodvariance),為了避免這種誤差,現在一般采用的辦法是在調研時就設計好X和Y來自不同的數據源,對於實在無法避免的,可以用一些統計的方法減小它的影響,詳細的過程請參考Richardson等(2009)和Williams等(2010)的文章。當然,還有一類關係是隱藏較深的“偽相關”,需要我們在理論上仔細分析和討論,並在數據檢驗時就想辦法排除X與Y相關的其他解釋。例如,有人研究企業對與創新的投入是否會通過提高員工創造性,進而提高企業的創新績效。如果僅僅看它們之間的相關關係,很可能發現它們都是正相關。但是有沒有可能是這幾個變量的背後都有一個共同的原因呢?如果一個規模很大、財力充足的優秀公司,是不是有可能同時在創新上的投入也高,其擁有的員工創新性也高,公司的創新績效也高呢?為了排除這個可能性,研究者就可以考慮分不同的時間點測量自變量和因變量,並且控製公司的規模、年利潤,而且要控製公司在初期時的創新績效。這樣才能夠說明公司之間創新績效的變化真的可能是由於創新投入的變化引起的。因此,雖然調研用的是相關關係,但是如果我們真的做到從理論出發提出假設,那麼就可以在研究設計時考慮得周到一些,盡可能嚴謹地提供因果關係所需要的數據支持。因此,當你以後有越來越多的經驗時,一定會發現這其實是不難判斷的:哪些研究是先有數據後寫故事的,哪些研究又是從理論出發,嚴謹地設計研究來檢驗假設的。而這兩種不同的研究方式也決定了一個研究的質量和結果的可信程度。