正文 第48章 矩陣對策(1 / 1)

矩陣對策就是兩人有限零和對策,兩個局中人的贏得之和總是等於零,即對策雙方的利益是激烈對抗的,一人的贏是建立在另一人的輸基礎之上的。“齊王賽馬”就是一個矩陣對策的例子,齊王和田忌各有6個策略,一局對策結束後,齊王的贏得必為田忌的損失,反之亦然。

由於假設兩個局中人都是理智的,所以每個局中人都必須考慮到對方會設法使自己的贏得最少,誰都不能存在僥幸心理。“理智行為”就是從最壞處著想,去爭取盡可能好的結果。

二、無鞍點的矩陣對策

通過上麵的討論可知,求解矩陣對策的第一步應該是找出對策的鞍點,但有些矩陣對策並不存在鞍點,亦即對策沒有平衡局勢。

我們稱此對策為沒有鞍點的對策,或稱對策在純策略下沒有解。

下麵我們由下例來說明這種對策的特點。

該矩陣對策在純策略意義下沒有解。這時,用最大最小原則來選取雙方的純策略都不會是穩定的,在這種情況下,局中人甲的最大最小策略和局中人乙的最小最大策略都不具有“最優”的性質。因為每個局中人可以選取另外的策略來改善自己的贏得值。在本例中,如果用最大最小原則,局中人甲應選取a2,如果局中人乙想到甲會采用a2,則乙就會采用b2,甲考慮到這點就會想到采用a1,乙想到甲可能采用a1,就會考慮采用b1來對付,在乙采用b1時,甲就要選取a2,等等。

在上述情況下,雙方都不能固定采用任何一個純策略,也就是說兩局中人都沒有自己的最優純策略(對策沒有鞍點)。他們必須考慮隨機地選取自己的策略(混合使用自己的各個策略),使對方捉摸不到自己使用的策略。

同樣,局中人乙隻取y1=14時,才能保證他的支出不多於52,所以,局中人甲以概率12選取a1,以概率12選取a2;局中人乙以概率14選取b1,以概率34選取b2參加對策,雙方都會得到滿意的結果。也就是說X=12,12和Y=14,34是局中人甲和乙的最優混合策略,(X, Y)是對策在混合策略下的解,52是相應的對策值。

從上麵的例子可以看出,對於沒有鞍點的對策,每個局中人參加對策時,不是決定用哪一個純策略,而是決定用多大概率選擇每一個純策略,以這樣一種方式選取純策略參加對策是雙方的最優策略。

“案例”

“非典”疫情擴散和防治

2003年4月,流行性非典型肺炎從廣東省通過輸入性病例的傳播進入北京。在華北地區“非典”疫情爆發初期,由於沒有有效地進行預防和控製,疫情迅速擴散和蔓延,疫情很快就開始在更廣泛的區域內傳播開來。這種局麵的出現,和SARS具有極強的傳染性有關,也與我們的防治工作不力有關。由於政府的監管力度不夠,少數醫生逃避責任,醫院之間也產生一種互相推諉病人的博弈關係。隨著疫情的發展,中央政府采取果斷措施,加強了領導和監管力度,逐步扭轉了這種不利的局麵。

1.疫情爆發初期的情況

在北京爆發SARS疫情的初期,重症患者出現致死,給醫護人員尤其是臨時護工們增添了巨大恐懼,許多人臨陣脫逃,以至於出現把月薪從350元增長到4000元也找不到一個護工的怪現象。個別醫院怕自己的醫護人員感染和影響單位經濟效益,拒收“非典”患者,部分醫護人員逃避責任,擅自離開工作崗位,致使病人到處求醫,成為流動的傳染源,感染“非典”的非北京籍病人離京返鄉,造成疫情的更大規模擴散。

當時情況下,由於對“非典”缺乏科學的認識,政府對其嚴重性認識不足,沒有采取有效的防治措施,對醫院也沒有建立嚴格有效的監管體製。醫院麵對的局麵是一種囚徒困境式的博弈問題。我們按照當時的情形建立。

可見,(拒收,拒收)為一個平衡解,醫院A、醫院B都拒收病人,致使帶著SARS病菌的病人四處求醫,造成疫情擴散,對人民的健康和生命安全造成巨大威脅,從而影響到整個社會的穩定。

2.疫情防治

在疫情發展過程中,隨著對SARS的逐步了解,政府及時總結經驗教訓,迅速出台一係列措施和規定來扭轉當時的不利局麵,如施行首診負責製,對拒收發熱病人的醫院嚴懲不貸。如果醫院不收治非典病人和疑似病人,那麼將受到嚴厲的懲罰和麵臨強大的輿論壓力。