博弈論的詭計全集-正文第185章以牙還牙

一天半夜，某教授正在熟睡之際，電話鈴突然響了起來。他睡眼惺忪拿起電話，聽筒裏傳來女鄰居怒氣衝衝的聲音：“麻煩你管一下你的狗，不要再讓它叫了。”說完，電話就掛了。這位教授十分生氣。第二天他定好鬧鍾，半夜兩點鍾準時起床，拿起電話撥通了這位女鄰居家。過了半天，對方才拿起聽筒，帶著睡意惱怒地問：“哪一位？”這位教授彬彬有禮地告訴她：“夫人，昨天我忘記告訴你了，我們家沒有養狗。”

在這個反映現實人際關係的小笑話中，我們可以發現在沒有法規和道德的約束，也沒有其他力量從外部對雙方進行強製時，對自己最有利的一種策略：一報還一報。這一策略的提出，應歸功於美國密西根大學的學者羅伯特·愛克斯羅德。他是一個政治科學家，研究方向是人與人之間的合作關係。

在開始研究合作之前，愛克斯羅德設定了兩個前提：一，每個人都是自私的；二，沒有權威幹預個人決策。也就是說，個人可以完全按照自己利益最大化的目標進行決策。在此前提下，要研究的問題是：第一，人為什麼要合作；第二，人什麼時候是合作的，什麼時候又是不合作的；第三，如何使別人與你合作。

在研究的過程中，愛克斯羅德組織了一場計算機模擬競賽。思路非常簡單：任何參加這個競賽的人都扮演囚徒困境案例中一個囚犯的角色，把自己的策略編成計算機程序，進行捉對博弈，在合作與背叛之間做出選擇。但與囚徒困境案例有個不同之處：他們不止玩一次這個遊戲，而是以單循環賽的方式玩上200次。這就是博弈論專家所謂的“重複的囚徒困境”，它更逼真地反映了具有經常而長期性的人際關係。

這個遊戲還允許程序在做出合作或背叛的抉擇時，參考對手程序前幾次的選擇。如果兩個程序隻玩過一個回合，則背叛顯然就是唯一理性的選擇。但如果兩個程序已經交手過多次，則雙方就建立了各自的曆史檔案，用以記錄與對手的交往情況。同時，它們也通過多次的交手樹立了或好或差的聲譽。

雖然如此，下一步將會如何行動卻仍然極難確定。實際上，這也是該競賽的組織者愛克斯羅德希望從這個競賽中了解的事情之一：一個程序能夠總是不管對手做何種舉動都采取合作的態度嗎？或者，它能總是采取背叛行動嗎？它是否應該對對手的舉動報之以更為複雜的舉動？如果是，那會是怎麼樣的舉動呢？

第一輪遊戲有14個程序參加，其中包含了各種複雜的策略。再加上愛克斯羅德自己的一個隨機程序（即以50％的概率選取合作或背叛）。使愛克斯羅德和其他人深為吃驚的是，競賽的桂冠屬於一個被稱為“一報還一報”的策略，它是由多倫多大學的數學教授阿納托·拉波波特提交上來的。

有意思的是，在科學家們上交的14個程序中有8個是“善意的”，但正是這些永遠不會首先背叛的善意程序，輕易地贏了6個非善意的程序。