正文 第23章 正態分布—鍾形曲線的妙用與濫用(1)(1 / 3)

把鍾形曲線用在商業領域是不合適的。

—彼得·德魯克

瘋子,就是用錯誤前提進行正確推理的人。

—約翰·洛克

真是令人震驚:鍾形曲線竟然成為風險管理工具,被監管者和穿深色西服、以乏味的方式談論貨幣的中央銀行人員使用。

—尼古拉斯·塔勒布

一棵樹上的果子有大有小,但大部分都是中等的。河裏的石子有圓有扁,但多數屬於不太圓也不太扁的。巨人很少見,侏儒也很稀少,多數人是身高中等的普通人。隻要樣本足夠多,那麼這個樣本群體的情況就會呈現一種規律性。但這種規律卻很可能被濫用……

“數學王子”與鍾形曲線

德國數學家高斯被認為是最重要的數學家,享有“數學王子”的美譽。

高斯的母親是一個貧窮石匠的女兒,雖然十分聰明,卻沒有接受過教育,近似於文盲。高斯的父親曾做過園丁、工頭、商人的助手等。

在整個數學史上,沒有人像高斯那樣早熟,比如高斯三歲時便能夠糾正他父親借債賬目的事情。

高斯自己曾說,他在草堆上學會了計算。能夠在頭腦中進行複雜的計算,是上帝賜予他一生的天賦。

當高斯12歲時,已經開始懷疑元素幾何學中的基礎證明。當他16歲時,預測在歐氏幾何之外必然會產生一門完全不同的幾何學,即非歐幾裏得幾何學。高斯的傳奇、奇聞異事可以寫成厚厚一部故事集。

18歲時,高斯開始專注於曲麵與曲線的計算,並成功得到高斯鍾形曲線(正態分布曲線)。其函數被命名為標準正態分布(或高斯分布),並在概率計算中大量使用。

鍾形曲線是一根兩端低中間高的曲線。高斯用它來描述科學觀察中量度與誤差兩者的分布。

在鍾形曲線上,大部分觀察值都積聚於中間,曲線上的極點對統計結果影響不大。比如,隨機挑選1000個男人進行身高統計,他們之中接近平均值的分布最多,巨人和侏儒分布最少,這種分布就符合正態分布。自然界中的很多隨機變量,可以近似地用鍾形曲線來描述:

一棵蘋果樹上的蘋果有大有小,把這些蘋果一一稱重,會得到一條鍾形曲線。

河床上布滿了鵝卵石,這些石子有圓有扁,把這些鵝卵石的曲度統計出來,也會形成一條鍾形曲線。

茫茫人海,總會有幾個巨人,也會有幾個袖珍人,但大部分人是身高中等的普通人。

同質群體的身高、紅細胞數、血紅蛋白量、膽固醇等,呈現為正態或近似正態分布。

……

隻要樣本足夠多,那麼這個樣本群體的情況就會呈現一種規律性。

數學不會錯,但數學會被用錯

類似這種說法你可能聽說過:

“××效應無處不在!”

“萬事萬物都逃不開××法則!”

說者如此亢奮,仿佛真的發現了一條能解釋宇宙萬物的絕對真理。

就連高斯自己恐怕也沒有想到,自己發現的鍾形曲線,會被泛濫地運用到社會生活的各個方麵。

前麵講過,“統計狂人”高爾頓爵士通過研究豌豆遺傳和人類世代演變,聯想到了均值回歸理論,這個重要理論使得鍾形曲線在很多情況下具有可操作性。

與高爾頓大約同時代,有個數學家叫凱特勒,他號稱:“鍾形曲線無處不在!”

凱特勒要把鍾形曲線用在一切地方,他要把世界納入他的平均哲學中。

凱特勒提出,人的特性均趨向於鍾形曲線的均數或中數,越靠兩極越少。凱特勒從統計學角度出發看人,認為人的成長會依從一套既定的法則。所以,我們可以透過統計數字,去推算一個人的發展。他還發明了通過身高體重比(BMI)來推算一個人的健康狀況。