博弈論的詭計：日常生活中的博弈策略：相互依存與均衡_王春永

漢代劉向的《新序》中有這樣一個故事。春秋末期，晉國的執政者趙襄子喝酒，五日五夜沒有停杯，仍然沒有醉倒。趙襄子十分自豪地對侍候在身邊的人說：「我真是國中最出色的人呀！喝酒五天仍不覺難受。國內應該沒有人能夠比得上我了。」弄臣優莫恭恭敬敬地回答說：「你還可以接著喝！紂王一連喝了七日七夜，現在您才是五日五夜。」趙襄子聽了以後，有些緊張地放下酒杯問道：「如此說來，我要滅亡了嗎？」優莫答道：「還不至於滅亡。」趙襄子問：「我跟紂王只差兩天了，不滅亡還等什麼？」優莫回答道：「夏桀和商紂的滅亡，是因為分別遇上了對手商湯和周武王，現在天下各國的君主全是夏桀一類的人物，而您和商紂王類似。夏桀和商紂同時存在一個時代，彼此都沒有被消滅的危險。不過，長此以往，事情就難說了！」

其實不僅是昏君與明主之間，所有博弈參與者的策略都有相互依存的關係。每一個博弈者從博弈中所得結果的好壞不僅取決於自身的策略選擇，同時也取決於其他參加者的策略選擇。有時甚至一個壞的策略也會帶來並不壞的結果，原因是對方選擇了更壞的利他而不利己的策略。

2006年9月29日，年度「超級女聲」大賽在掌聲和歡呼聲中謝幕，尚雯婕憑借5196975的票數登上冠軍寶座。有人發出疑問：與2004年的冠軍安又琪相比，她沒有出眾的外表；與2005年的冠軍李宇春相比，她沒有傾倒觀眾的舞台魅力；與2006年亞軍譚維維相比，她沒有「無可挑剔」的唱功。那她憑什麼奪冠呢？

實際上，這個疑問本身就反映了疑問者對於博弈論的不瞭解。這個冠軍本來就不是尚雯婕一個人得到的，而是在主辦方湖南電視台和天娛傳媒、參賽的女生們、電視觀眾、媒體、各女生的「粉絲」(fans)等方方面面共同博弈的結果。

每一次超級女聲的比賽，電視上幾個女生在台上比賽唱歌跳舞，而實際上真正的博弈在屏幕之外。以主辦方來說，就不斷根據觀眾的反應而修改策略，從開始的評委打分到專業評委、大眾評審團、短信共同決定，再到最後完全靠短信決勝負，這種修改可以看做對形勢發展的妥協，也可以解釋為追求商業利益最大化的對策。有人認為整個過程中還出現了非合作博弈與合作博弈的可能：某些得分較低的女生的「粉絲」，聯手對付得分高的選手；得分最高的選手聯合肯定無望出線的選手以鞏固地位，防止次高選手反超。

這就是一種相互依存的博弈，而相互依存的策略就構成一種均衡。

均衡可以說是博弈論中最重要的思想之一，但是卻並不複雜。我們可以用描述法來加以定義：在博弈達到均衡時，局中的每一個博弈者都不可能因為單方面改變自己的策略而增加收益，於是各方為了自己利益的最大化而選擇了某種最優策略，並與其他對手達成了某種暫時的平衡。在外界環境沒有變化的情況下，倘若有關各方堅持原有的利益最大化原則並理性面對現實，那麼這種平衡狀況就能夠長期保持穩定。

在所有的均衡中，納什均衡又是一個基礎性的概念。簡單地說，所謂納什均衡就是所有人的選擇綜合在一塊，不一定所有選擇都能實現最大化原則，但能使所有人都達到最大化的均衡狀態。諾貝爾經濟學獎獲得者薩繆爾森有<一句調侃的話：你可以將一隻鷚鵡訓練成經濟學家，因為它所需要學習的只有兩個詞——供給與需求。博弈論專家坎多瑞引申說：要成為現代經濟學家，這只鸚鵡必須再多學一個詞，這個詞就是「納什均衡」。

在現實生活中，有相當多的博弈，我們無法使用嚴格優勢策略均衡或重複剔除的優勢策略均衡的方法找出均衡解。比如在房地產開發中，假定市場需求有限，只能滿足某種規模的開發最，A、B兩個開發商都想開發這一規模的房地產，而且，每個房地產商必須一次性開發這一規模的房地產才能獲利。在這種情況下，無論是對開發商A還是對開發商B，都不存在一種策略優於另一種策略，也不存在嚴格劣策略(所謂嚴格劣策略是指在博弈中，不論其他人採取什麼策略，某一參與人可能採取的策略中對自己嚴格不利的策略)。如果A選擇開發，則B的最優策略是不開發；如果A選擇不開發，則B的最優策略是開發。反之亦然。研究這類博弈的均衡解，需要引入納什均衡。

在納什均衡中，每個博弈參與人都確信，在給定其他參與人的策略的情況下，己方選擇了最優策略以回應對手的策略。納什均衡是完全信息靜態博弈解的一般概念，構成納什均衡的策略一定是重複剔除嚴格劣策略過程中不能被剔除的策略。

納什均衡是著名博弈論專家納什對博弈論的重要貢獻之一。納什在1951年的兩篇重要論文中，從一般意義上給定了非合作博弈及其均衡解，並證明瞭解的存在性。正是納什的這一貢獻莫定了非合作博弈論的理論基礎，他所定義的均衡也被稱之為「納什均衡」。

納什均衡是一種最常見的均衡。在納什均衡點上，每個參與者的策略是最好的，此時沒有人願意先改變或主動改變自己的策略。也就是說，此時如果他改變策略，他的收益將會降低，每一個理性的參與者都不會有單獨改變策略的衝動。

與重複剔除的佔優策略均衡一樣，納什均衡不僅要求所有的博弈參與人都是理性的，而且要求每個參與人都瞭解所有其他參與人也都是理性的。

在佔優策略均衡中，不論所有其他參與人選擇什麼策略，一個參與人的佔優策略都是他的最優策略。顯然，這一策略一定是所有其他參與人選擇某一特定策略時該參與人的佔優策略。因此，佔優策略均衡一定是納什均衡。

在重複剔除的佔優策略均衡中，最後剩下的唯一策略組合，一定是在重複剔除嚴格劣策略過程中無法被剔除的策略組合。因此，重複剔除的佔優策略均衡也一定是納什均衡。

需要注意的是，博弈的結果並不都能成為均衡。博弈的均衡是穩定的，因此可以預測。