因為參與競賽的程序為數不多,一報還一報策略的勝利也許隻是一種僥幸。為了進一步驗證上述結論,愛克斯羅德決定舉行第二輪競賽,邀請更多的人再做一次遊戲,並把第一次的結果公開發表。這一次有62位科學家遞交了改進的程序,其中包括多個以上一次的策略為基礎的改良品種。加上愛克斯羅德自己的隨機程序,63個程序又進行了一次競賽。競賽結果表明,在63個程序的前15名裏,隻有第8名的哈靈頓程序是“非善意的”;在最後15名中,隻有1個總是合作的程序是“善意的”。而且,奪魁的仍然是一報還一報策略。
這種讓幾十位科學家的智慧相形見絀的神奇策略到底是怎樣的呢?
說起來很簡單,簡單到有些不可思議:第一步合作,此後每一步都重複對方上一步的行動:合作或背叛。如此簡單的程序之所以反複獲勝,是因為它奉行了“以其人之道還治其人之身”的原則,並且用如下特征最有效地鼓勵其他程序同它長期合作:善良、可激怒、寬容、簡單、不妒忌別人的成功。
·善良,是指它第一步總是向對方表達善意。它堅持永遠不首先背叛對方,開始總是選擇合作,而不是一開始就選擇背叛或主動作弊。
·可激怒,是指對方出現背叛行動時,它能夠及時識別並一定要采取背叛的行動來報複,不會讓背叛者逍遙法外。
·寬容,是指它不會因為別人一次背叛,長時間懷恨在心或者沒完沒了地報複,而是在對方改過自新、重新回到合作軌道時,能既往不咎地恢複合作;
·簡單,是指它的邏輯清晰,易於識別,能讓對方在較短時間內辨識出來其策略所在;
·不妒忌,是指它不耍小聰明,不占對方便宜,不在任何雙邊關係中爭強好勝。
其他各種策略輸就輸在上述五個方麵做得不夠好。在比賽結果中,所有惡意程序(第一步背叛)都未進前10名;而某些程序太過好脾氣,被對方背叛之後不立即反應,結果鼓勵某些狡猾的程序反複占它的便宜;某些程序對於過往關係的“好壞”太過執著,一旦被別人欺騙就很難寬容,結果使得很多本來可能恢複的合作關係永久性斷絕;還有一些程序把自己搞得太複雜,總是試圖通過某種機巧來占人便宜,盡管在與某些“傻”程序接觸中得了高分,但一旦碰到個性“剛烈”的程序就會搬起石頭砸了自己的腳。而從最後的總分來看,它們的小聰明得不償失。
在香港電影《無間道》中有一句廣為流傳的台詞:“出來混,遲早要還的。”就是這句台詞決定了劇中不少人物的命運,無論是黑道還是白道,警還是匪,很多人物在以為自己勝券在握或逃出生天時,猝不及防地死去,用一條命來還了。
博弈智慧
在博弈論中,“還”也是早晚的事,不過這不是什麼宿命,而是“一報還一報”策略的出發點和立足點,也是它的勝利基點。