為了鼓勵合作,通常需要包含某種懲罰作弊者的機製。這種機製有助於減少雙方作弊的動機。在一次性博弈中,這種機製的作用無法發揮,因為沒有下一次的合作,作弊的行為也就無法得到懲罰。但在重複博弈中,一方背叛的出現,會在日後以損失的形式使其得到懲罰。如在遲到問題上,當遲到者沒能準時到達時,其受到的懲罰遠遠超過其遲到的收益,因此故意遲到的行為最終會消失。
通常來說,一般性的懲罰在解決一些簡單的問題上是有效的。但對於重大問題來說,則又另當別論。如在價格戰中,雖然雙方都簽訂了合作的協議,有的甚至還製訂了懲罰的辦法,但由於沒有執行這一機製的保證,那麼各方都有動機偏離合作,因為一方背叛的收益還是要遠遠高於合作的收益。
我們知道,在重複的囚徒困境中,簽訂合作協議並不難,製訂一個簡單的懲罰辦法也不是一件困難的事情,真正具有挑戰的事情是如何保證這一協議對雙方都有約束力。如果協議簽訂之後,沒有執行懲罰機製的約束,最後的結果還是會令人失望,博弈參與者在有限次重複博弈中仍有作弊的動機。
霍布斯曾經說過:“不帶劍的契約不過是一紙空文。它毫無力量去保證一個人的安全。”也就是說,沒有約束力的合作協議對合作毫無幫助。
在人類社會的長期博弈中,早已形成的法律可以說是對合作協議的有力保證。從博弈論的角度來看,法律就是通過第三方強製實施的行為規範,由於這一規範的強製性和權威性,能夠促使懲罰機製可信且有效執行。在一種有效的法治環境中,法律可以改善囚徒困境。
我們來看這樣一個例子。假設公司甲與公司乙是商業上的合作夥伴,公司甲經常向公司乙購買原材料,由於兩家公司在不同的城市,於是兩個公司經過談判之後簽訂買賣合同,一般在一周最後的那一天,公司甲將現金打入公司乙的銀行賬戶,公司乙則發貨到公司甲,若違約則處以2倍罰款。
實際上,公司甲與公司乙都是理性人,他們的合作就是一個有限次數重複博弈,在社會不存在法律的情況下,在兩個公司任何一次交易中都有可能存在其中一家公司不遵守合同,逃款或逃貨的風險,即使公司甲現金充裕,而公司乙貨源充足。
然而,在我們理想的法律環境下,兩公司最佳策略都是合作。我們不妨假設公司甲與公司乙每年的交易都有十幾次,平均每筆生意為100萬,若違約則罰款200萬。公司乙的產品成本為80萬,公司甲受到產品後可獲得淨收益也為20萬。
如果兩公司都選擇合作,雙方收益均為20萬(指兩公司各自的利潤);
如果公司甲合作,公司乙背叛,那麼公司甲付款後,公司乙不發貨,甲會損失100萬,乙收益100萬;
如果公司甲背叛,公司乙合作,那麼公司乙發貨後,公司甲不付款,公司甲收益120萬(其中包含20萬的利潤),公司B損失80萬(指公司B貨物的成本,也就是收入減去利潤);
如果兩公司都背叛,公司甲不付款,公司乙不發貨,雙方收益為零。
在沒有法律背景的條件下,雙方選擇不合作是自然的納什均衡點。然而當引入強製性的法律時,結果就會有所不同,這時他們所簽合同具有法律效應,一旦有一方違約,另一方有權罰款其200萬元,並且法院可以強製執行。
在這種情況下,合作才是兩個公司的最佳策略。簡單說來,就是法律通過懲罰的有力保證,改變了兩個公司博弈的均衡結果。
霍布斯認為,國家以法律形式規定對某種行為如“違約”采取懲罰措施,但是如果懲罰措施不力,即使扣除懲罰的成本,行動者從“違約”策略中獲取的好處也大於他采勸守信”策略所帶來的好處,那麼國家的法律措施是無效率的或者說是低效率的。因此國家法律的製定應以抑製對他人的危害行動為原則。這就是使得懲罰有效的一個重要前提。
在我們的社會中,當涉及公共物品時,普遍存在著“社會悖論”的問題。人類共有的資源是有限的,當每個人都從自身利益出發企圖多占有一些資源時,就會產生個人利益與集體利益的衝突。公共地的悲劇、人口問題、大氣汙染等都可以在社會悖論中得以解釋。在這些問題中,關鍵是要製訂遊戲規則來控製每個人的行為。
博弈智慧
作為第三方的法律無疑是一個有效的手段。法律以其強製性和至高無上的權威,能使所有的人都遵守法律的約定,包括製定與執行法律的人,否則必然要受到無法逃脫的懲罰。這一懲罰改變博弈的結果,使得合作得以促成。