第二十六章均衡博弈:優勢策略和劣勢策略的終極
在均衡博弈中,一個優勢策略優於任何其他策略;同樣,一個劣勢策略則劣於任何其他策略。如果你有一個優勢策略,你可以選擇采用;同樣,假如你有一個劣勢策略,你應該避免采用。
從愛情故事中解讀優劣策略與均衡
美國著名批判現實主義作家歐·亨利在其小說《麥吉的禮物》中描述了這樣一個愛情故事:
新婚不久的妻子和丈夫,很是窮困潦倒。除了妻子那一頭美麗的金色長發,丈夫那一隻祖傳的金懷表,便再也沒有什麼東西可以讓他們引以為傲了。雖然生活很累很苦,他們卻彼此相愛至深。每個人關心對方都勝過關心自己。為了對方,他們願意奉獻和犧牲自己的一切。
明天就是聖誕節了,小兩口都是身無餘錢。為了讓愛人過得好一點,兩個人都想悄悄準備一份禮物給對方。丈夫賣掉了心愛的懷表,買了一套漂亮發卡,去配妻子那一頭金色長發。妻子剪掉心愛的長發,拿去賣錢,為丈夫的懷表買了表鏈。
最後,到了交換禮物的時刻,他們無可奈何地發現,自己如此珍視的東西,對方已作為禮物的代價而出賣了。花了慘痛代價換回的東西,竟成了無用之物。出於無私愛心的利他主義行為,結果卻使得雙方的利益同時受損。
歐·亨利在小說中寫道:“聰明的人,送禮自然也很聰明。大約都是用自己有餘的物事,來交換送禮的好處。然而,我講的這個平平淡淡的故事中的兩個傻孩子,卻是笨到極點,彼此為了對方,白白犧牲了他們屋簷下最珍貴的財富。”
從這段文字看,歐·亨利似乎並不認為這小兩口是理性的。且讓我們暫時拋開愛情的溫馨,單從利益的角度來解讀。
馮·諾伊曼認為:在一個二人零和遊戲中,總會找到一種明確而合乎理性的方法以獲得個人的最佳利益,而這個“明確而合乎理性的方法”就是“極小極大原理”。諾伊曼的這一發現可能是博弈論最重要的核心內容。
何謂“極小極大原理”呢?用通俗一點兒的話說就是,你想贏得競爭,可能有幾種選擇,你當然願意選擇受益最大的一種;但是你的選擇不能不考慮到對方的決策,因為他跟你一樣,也是這樣想的,所以你必須把對方的選擇也考慮清楚。比如上麵這個愛情故事中,因為雙方都以自己的付出視為最大的受益,所以麵對付出和不付出這兩種策略選擇,他們都會選擇付出,選擇了付出,無論對方作出何種決策,其效果都比另一種——不付出,要好,此時的付出策略就被稱為這場博弈中的“優勢策略”。反之,不付出是這場博弈的“劣勢策略”,也即在博弈中,不論對方采取什麼策略,在我們可能采取的策略中,對自己嚴格不利的策略,劣勢策略是我們在日常生活中不可以選擇的行動。顯然,如果雙方都選擇優勢策略,那麼這個博弈就是有跡可循、可以預測的,也就是所謂“理性的解”,並形成某種“定式”,即均衡。
實際上,上麵的例子有一個優勢策略均衡。通俗地說,在優勢策略均衡中,不論所有其他參與人選擇什麼策略,一個參與人的優勢策略都是他的最佳策略。顯然,這一策略一定是所有其他參與人選擇某一特定策略時該參與人的占優策略。
再舉個常見的例子:一名籃球前鋒和隊友在籃下麵對著對方的一個後衛時,形成了二打一的局麵。該前鋒可以選擇直接投籃,也可以選擇傳球給隊友,根據經驗,傳球過人的成功率更大,那麼傳球就是該前鋒的優勢策略。即某些時候它勝於其他策略,且任何時候都不會比其他策略差。
如果一個球員,無論其他球員怎麼做,他的策略都會高出一籌,那麼這個球員就有一個優勢策略。當然如果一個球員有這麼一個優勢策略,他的決策就會變得非常簡單,隻需直接采用該策略而完全不必考慮對手的應對策略。
還有一個要注意的問題,即采用優勢策略得到的最壞結果並不一定比采用另外一個策略得到的最佳結果要好,這是很多博弈論普及書中容易出錯的一個問題。應該說,對局者所采用的優勢策略在對方采取任何策略時,總能夠顯示出優勢。
同時行動中的優勢策略
博弈實際上就是互動的策略性行為,在每一個利益對抗中,人們都是在尋求滿足自身利益最大化的優勢策略。另外,博弈的精髓在於參與者的策略相互影響、相互依存。這種互動通過兩種方式體現出來。
其中一種互動方式是同時行動。比如囚徒困境故事中的情節,參與者同時出招,完全不知道其他人走哪一步。不過,每個人必須心中有數,知道這個博弈遊戲存在其他參與者,其他參與者也非常清楚這一點。因此,每個人必須設想一下若是自己處在其他人的位置,會作出什麼反應,從而預計自己這一步會帶來什麼結果。他選擇的最佳策略也是這一全盤考慮的一個組成部分,
無論對方采取何種策略,均應采取自己的優勢策略。這正是博弈論研究的主題,為了理解這一點,我們來看一個新聞大戰的案例。
美國的兩大雜誌《時代》和《新聞周刊》在每個星期都會暗自較勁,對於作為周刊的《時代》來說,作出引人注目的封麵故事是非常重要的。因為一個饒有趣味的封麵,可以吸引站在報攤前的潛在買主的目光。所以說,《時代》的編輯們每個星期都會舉行閉門會議,選擇下一個封麵故事。