讀古今文學網 > 博弈論的詭計:日常生活中的博弈策略 > 亂拳打死老師傅 >

亂拳打死老師傅

        一位學藝歸來的拳師,與老婆發生了爭執。老婆摩拳擦掌,躍躍欲試。拳師心想:「我學武已成,難道還怕你不成?」沒曾想尚未擺好架勢,老婆已經張牙舞爪地衝上來,三下五除二,竟將他打得鼻青臉腫,沒有還竽之力。事後別人問他:「既然學武已成,為何還敗在老婆手下?」拳師說:「她不按招式出拳,我怎麼招架?"

        民間早就有「亂拳打死老師傅」的說法,意思是如果一切都沒有聿法,連老師傅都無法招架呢。這裡的「亂拳」,可以看做是隨機混合策略的一種形象叫法。

        有一個遊戲叫做「一、二、三射擊」或稱「手指配對」。在這個遊戲中,其中一個選手選擇「偶數」,另外一個選手則得到「奇數"。數到三的時候,兩個選手必須同時伸出一個或者兩個手指。假如手指的總數是偶數,就算「偶數」選手贏;假如手指的總數是奇數,就算「奇數」選手贏。

        那麼怎樣才能保證自己不被對手所贏呢?

        有人的回答是閉著眼「瞎出」。這話說對了一半,因為從博弈論的角度來看,「瞎出」也存在著一種均衡模式,必須加以計算。

        因為只有奇、偶兩種結果,整個局面是如此對稱,以至於各個選手的均衡混合策略應該都是50:50。我們這就驗證一下:假如「奇數」選手出一個指頭和兩個指頭的機會是各一半,那麼,「偶數」選手無論選擇出一個還是兩個指頭,平均每場遊戲將會贏得0.50×l+0.50×(-1)=0元。

        因此,假如他的策略也是50:50,那麼他的平均所得就是0元。同樣的證明反過來也適用。因此,50:50混合策略對彼此都是最佳選擇,它們合起來就是一個均衡。

        這一解決方案就是混合策略均衡,它反映了個人隨機混合自己的策略的必要性。

        與手指配對遊戲不同,很多情況下我們不應該將不可預測性等同為輸贏機會相等,而是應該通過有計劃地偏向一邊而改善自己的表現,只不過這樣做的時候應該確保對方不能預見。在警察與小偷博弈中,警察系統地偏向銀行,就是一種十分合理而且很容易理解的改善方式。但是同時,警察必須打亂自己的巡邏目標才能降低小偷盜竊成功的概率。這麼一來,他會讓小偷永遠處於迷茫之中,也就沒有辦法獲得準確預測的優勢了。

        從警察和小偷的不同角度計算最佳混合策略,會得到一個有趣的共同點:同樣的成功概率。也就是說,警察若採用自己的最佳混合策略,就能將小偷的成功概率拉到他採用自己的最佳混合策略所能達到的成功概率。

        這並非巧合,而是兩個選手的利益嚴格對立的所有博弈的一個共同點。

        這個結果稱為「最小最大定理」,由數學家約翰‧馮‧諾伊曼(John Von Neumann)創立。這一定理指出,在二人零和博弈中,參與者的利益嚴格相反(-人所得等於另一人所失),每個參與者盡量使對手的最大收益最小化,而他的對手則努力使自己的最小收益最大化。

        他們這樣做的時候,會出現一個令人驚訝的結果,即最大收益的最小值(最小最大收益)等於最小收益的最大值(最大最小收益)。雙方都沒辦法改善自己的收益,因此這些策略形成這個博弈的一個均衡。

        最小最大定理的證明相當複雜,不過,其結論卻很實用。假如你想知道的只不過是一個選手之得或者另一個選手之失,你只要計算其中一個選手的最佳混合策略並得出結果就行了。

        所有混合策略的均衡具有一個共同點:每個參與者並不在意自己的任何具體策略。一旦有必要採取混合策略,找出你自己的策略的方法,就是讓對手覺得他們的任何策略對你的下一步都沒有影響。

        這聽上去像是朝向混沌無為的一種倒退,其實不然。因為它正好符合零和博弈的隨機化動機:一方面要發現對手任何有規則的行為,並相應採取行動。假如他們確實傾向於採取某一種特別的行動,這只能表示他們選擇了最糟糕的策略。反過來,也要避免一切會被對方佔便宜的模式,堅持自己的最佳混合策略。

        因此,採取混合或者隨機策略,並不等同於毫無策略地「瞎出」,這裡面仍然有很強的策略性。其基本要點在於,運用偶然性防止別人發現你的有規則行為並佔你的便宜。