畫一條線或者建立一個方程或公式,並使得它似乎描述了存在於數集之中的規律,這樣做相當容易,但沒有任何實際價值。這些捏造出的虛假規律看起來令人信服,它們用數學語言來偽裝自己,但是,當人們真的想運用它們來預測現實(利用這些規律來表明宇宙中出現的新鮮事物)時,它們就完全無效了。盡管如此,科學家、經濟學家、公共衛生專家以及一切有權使用入門級統計軟件的人,都以令人難以置信的速度捏造著毫無意義的線、方程式和公式。這又是一種特殊類型的“數字的騙術”——“胡亂回歸分析”。
回歸分析是一種數學工具,人們可以運用它推導出線、方程式和公式來恰當地解釋數集。這是一種特別強有力的技能,可以迅速在給定的數集中總結出規律。然而,如果人們胡亂使用它,所得結果就可能毫無意義,就像瘋子嘟囔時的胡言亂語。上文中提到了兩個宣稱女運動員會超過男運動員的預測,它們就是“胡亂回歸分析”的典型案例,因為科學家們從數集中找出來的規律根本就是荒謬的,這些“規律”直接可以推導出“運動員最終的奔跑速度會超過光速以至於時光倒流”的可笑結論,我們憑此就能一眼看穿這些“規律”的虛假性。不過,“胡亂回歸分析”所導致的問題通常是更加隱晦且難以看穿的。
在20世紀80年代,經濟學家們一窩蜂地努力研究著來自耶魯大學的一個科研話題。一位名叫雷·費爾的年輕經濟學家根據1912~1976年的經濟數據作了一項回歸分析,然後得出了一個如果成立就將轟動一時的方程式,該方程式可以提前預測誰會在接下來的總統競選中獲勝。你僅僅需要在方程式中輸入幾個經濟要素——通貨膨脹率、國內生產總值增長率等。瞧!下一位總統就計算出來啦。那麼,戰爭、國債、外交政策呢?這些幾乎都是無關緊要的,經濟形勢完全決定了每次總統競選的勝利者。經濟學家們肯定會喜歡上這個方程式。
1980年,費爾的方程式預測,裏根會在二選一的角逐中以55.4%的得票率戰勝卡特。後來,裏根的確拿到了55.3%的選票。全世界經濟學家都為這個方程式的精準程度而激動萬分。1984年,費爾預測裏根會大勝蒙代爾而連任。他說對了。1988年,這個方程式顯示老布什會輕鬆戰勝杜卡基斯。老布什做到了。經濟學家們向神機妙算的費爾致敬,費爾則得意洋洋地吹噓著他的預測的準確性。他的方程式被視為令人驚歎的、準確的經濟預測的標準範式,並在經濟學專業大一新生的課堂上向學生傳授。然而,費爾在1992年宣稱,老布什會以57.2%的得票率擊敗新晉候選人克林頓,憑借公眾那勢不可當的支持回到白宮進入他的第二個總統任期。
嗤嗤……你或許可以想象一下,在最終選舉結果揭曉後,經濟學家們那膨脹的自負是如何被擊得粉碎的。費爾被迫低調地修改了他的方程式,以便“糾正”他之前犯下的錯誤。在1996年美國大選前,他又勇敢地在一份報紙上公布了下一個預測:“按照方程式推導出的基本結論是,美國共和黨人會在1996年大選中略占優勢。”噢,他又錯了。美國民主黨人克林頓完勝美國共和黨人多爾,他的領先優勢跟1980年裏根戰勝卡特時一樣明顯。
真正的問題是,費爾的方程式就是典型的“胡亂回歸分析”的產物。它是一個精心製作的數學模型,並用以表達費爾從數據中找到的“規律”,但這個“規律”本身就是毫無意義的。(費爾的成功可歸結為一個常識性的結論,那就是在任總統會因良好的經濟狀況而受益。)方程式可以完美地解釋過去的競選結果,但用它來預測未來的競選結果顯然是不可能的,這便是虛假規律的典型特征。幾乎所有的競選預測都有著同樣的問題。經濟學家和其他領域的專家們年複一年地修正著他們那不靠譜的數學模型,並據此作出多數情況下都錯得離譜的預測。他們甚至在一個缺乏新聞素材的日子裏把預測結果發表到了一份赫赫有名的報紙的第二版上,題為“一切都還沒有結束”。一位經濟學家在2000年某一期的《華盛頓郵報》的第一版上發表文章,預測戈爾會在二選一的角逐中贏得56.2%的選票。當然,他又貽笑大方了。我受夠了這些預測家的喧囂,在《華盛頓郵報》上發表了一篇文章,使用令人費解的4組Kn?del數列來預測美國總統競選的結果,其結論能夠與1952年以來的曆次競選結果相符合。認為某組數列可以決定在總統競選中的獲勝者,這種想法著實很荒謬可笑,不過並不比經濟學家們采用“胡亂回歸分析”所得到的預測結論更荒謬可笑和離譜。