從囚徒的兩難到針鋒相對
讓我們來談談博弈論者提出的“囚徒的兩難境地”這個話題。
警察想從被分別關押的兩個囚徒身上掏出口供來,兩個囚徒的表現可以概括成以下三種情況:
1。兩人都不肯背叛同夥,都保持沉默,結果是警局沒有證據,兩人獲得釋放。
2。其中一個背叛同夥,背叛者獲釋,並得到重獎;而不肯背叛的人被判了重刑。
3。兩人都背叛了對方,都判以重刑。
這種“囚徒的兩難境地”並不是博弈論者憑空想象出來的。隻要我們仔細地回想一下現實生活,就知道人類數千年來到處都在做著這樣一種“遊戲”。例如秦國為了瓦解六國的合縱,除了連橫策略之外,就是用收買和打擊這兩手來製服六國的貴族,對於那些知名人士,能拉攏的就重金收買,不能拉攏的就派武士去暗殺。當今世界上的霸權國家,也是使用胡蘿卜加大棒的手法在與那些它們認為不聽話的國家打交道。弱國為了自己的利益與生存,相互結盟(今天的歐盟、東盟、北約等就是這樣的結合),同時又害怕盟友背叛自己而恐懼著,不時地改變著自己的主張,或是投靠強國,或是采用其他的方法以保全自己。
那麼,這兩個囚徒最好的辦法是什麼呢?
最好的辦法是保持沉默,即相互都不背叛。如果有一方背叛,那麼另一方將來出獄之後也不會輕易罷休,一定會給那個背叛者以更重的懲罰。
羅伯特·愛克斯羅德是一位政治科學家,他是美國密歇根大學巴奇小組的成員。他想出了一個測試的辦法,在電子計算機上展開競賽以顯示兩個囚徒之間的互動關係。他組織的競賽思路非常簡單,即參加競賽中的人兩兩分對,都扮演其中一個囚徒的角色,任何想參加這個程序的人都被成雙成對地融人不同的組合之中去,即讓參加比賽的科學家都來玩“囚徒的兩難境地”遊戲。每一個人都可以在結盟與背叛中作出選擇。但是他們不是隻玩一次這樣的遊戲,而是一直玩下去,玩上200次甚至更多。這就像魏、蜀、吳三國那樣,魏國可以同蜀國結盟,也可以相互背叛;蜀國也可以同吳國結盟,同時也允許相互背叛。這多次的遊戲實際上表現在人類在長期的人際關係中,這種關係已經延續數萬年或者數千年之久了,而多次的重複就可以用概率論來加以概括了。
這種重複的遊戲允許程序作出合作或背叛的抉擇時參考前幾次的選擇。如果隻玩一次遊戲,那麼背叛當然是最好的選擇;但是如果玩許多次,情況就不一樣了。因為雙方都已經了解了對手前幾次的選擇,各自都建立起了自己的曆史和這方麵的聲譽,有了過去的資料可供參考。不過,對於下一次對方如何出脾,仍是一個未知數。
這位政治科學家的意圖是十分明確的,他想測試一下,人類不管對手做何種舉措,是一上來就采取信任和合作的態度,還是一上來就采取背叛的辦法。抑或還有一種另外的表現,例如後發製人——你敬我一尺,我敬你一丈,你不仁,我就不義!
那麼,他們比賽的結果是怎麼樣的呢?
“事實上,競賽的第一回合後交上來的十四個程序中包含了各種複雜的策略。但使愛克斯羅德和其他人深為吃驚的是,桂冠屬於最簡單的策略:針鋒相對。這是多倫多大學心理學家阿納托·拉帕波特提交上來的策略。針鋒相對的策略以合作(結盟)開局,但從此以後就采取以其人之道、還治其人之身的策略,它實行了胡蘿卜加大棒的原則。它永遠不先背叛對方,從這個意義上來說它是善意的;它會在下一輪中對對手的合作進行回報,從這個意義上說它是寬容的;它又會采取背叛的行動來懲罰對手上一次的背叛,從這個意義上來說它是強硬的;它的策略非常簡單,對手一望便知其用意何在,從這個意義上來說它又是簡單明了的。
“當然,因為隻有為數不多的程序參與了競賽,針鋒相對策略的勝利也可能隻是一種僥幸,但也許不是,在上交的十四個程序中,有八個是善意的,它永遠不會首先背叛,而且這些善意的程序都輕易就贏了六個非善意的程序。為了決出一個結果來,愛克斯羅德又舉行了第二輪競賽,特別邀請人們從針鋒相對策略那裏把桂冠奪過來。這次有六十二個程序參加了競賽,針鋒相對策略又一次奪冠。結論是無可爭議的,好人,或者更正確地說,善意的、寬容的、強硬的、簡單明了的人,確實總是贏家。
“針鋒相對策略的勝利對生物進化和人類事務所具有的深刻含義是顯而易見的。愛克斯羅德在1984年發表的《合作進化》一書中認為,針鋒相對策略能導致各個領域的合作,包括最無指望的環境中的合作,仡最喜歡舉的例子就是第一次世界大戰中自發產生的自己活,也讓他人活的原則。當時在前線戰壕裏的軍隊約束自己不開槍殺傷人,隻要對方也這麼做。處於無人區的軍隊根本無法與地方軍隊取得聯係,而且他們當然也不會是朋友。”(米歇爾·沃爾德羅羅:《複雜》,生活·讀書·新知三聯書店1997年4月版)
愛克斯羅德等人在電腦中進行的對手間的策略競賽,是從囚徒的兩難境地問題演化過來的。兩個人在一起做事,是合作還是背叛,這恐怕是全人類每一個人幾乎都會碰到的事情。這一次被人出賣了(受騙上當了),下一次再碰到了那個人會怎麼辦?這一次欠了他人的情,下一次遇上了會怎麼辦?這實在是司空見慣的事,也是我們經常要思考的問題。“好,這個人有信用,下一筆生意我們還找他做。”“這家夥太差勁了,是親戚他還敢騙,下次給他點顏色瞧瞧!”“你敬我一尺,我敬你一丈,你若是給我小鞋穿,對不起,我就送給你一雙玻璃小鞋。”像這樣一些議論我們不是經常聽得到嗎?這實際上都是在講“針鋒相對”的策略,隻是我們沒有把它歸納總結而已。
針鋒相對策略的優越性
那麼,針鋒相對的策略為什麼是最佳的策略呢?讓我們從“赤壁之戰”的例子來看一看吧。
1。曹操帶領五十萬兵馬南征,準備消滅劉備,兼及孫權,這時候正麵承受壓力的有三股力量,即劉表的力量、劉備的力量和孫權的力量。
劉表死後,小兒子劉琮當權,他聽從幕臣和母親的意見,采取了投降的策略,結果是怎麼樣呢?
(曹操)讓劉琮為改任青州刺史,便叫他立即起程,劉琮一聽大驚,推辭道:“我不願為官,隻希望駐守在父母鄉土上。”曹操說道:“青州這地方接近帝都,叫你隨朝為官,是為了避免在荊襄這裏被人圖害。”劉琮再三推辭,曹操就是不準。劉琮隻得與母親蔡夫人同赴青州。隻有故將王威願意相隨跟去。其餘官員都送到江口就回去了。曹操叫過於禁,對他囑咐說:“你可以帶一些輕騎去追趕劉琮母子,追到後把他們殺了,以絕後患。”於禁得令,便帶領眾軍趕上,大聲喝道:“我奉了丞相命令,來殺你們母子!你們可早納下首級!”蔡夫人抱著劉琮大哭。於禁喝令軍士下手。王威憤怒,奮力相鬥,競被眾軍所殺,軍士殺死劉琮及蔡夫人。於禁回報曹操,操重賞了於禁。