博弈論的詭計：日常生活中的博弈策略：蜈蚣博弈的悖論_王春永

一個人打算向鄰居借斧子，但又擔心鄰居不肯借給他，於是他在前往鄰居家的路上不斷胡思亂想：「如果他說自己正在用怎麼辦？」「要是他說找不到怎麼辦？」想到這些，這人自然對鄰居產生了不滿：「鄰里之間應該和睦相處，他為什麼不肯借給我？」「假如他向我借東西，我一定會很高興地借給他。」「可是他不肯借斧頭給我，我對他也不應該太客氣」……

這人一路上越想越生氣，於是等到敲開鄰居的門後，他沒有說「請把你的斧子借給我用一下吧」，卻張嘴說道：「留著你的破斧子吧，我才不稀罕你的東西！」

從上面這個笑話中，可以想像一些喜歡以己度人者在生活中遇到的尷尬。但是笑過之後，我們卻發現，這個借斧頭的人所運用的思維方法，居然有著倒推法的影子。

難道倒推法真的有什麼問題嗎？答案是肯定的，這種悖論在博弈論中被稱為「蜈蚣博弈悖論」。很多學者已經用科學的方法推導出：倒推法是分析完全且完美信息下的動態博弈的有用工具，也符合人們的直覺，但是在某種情況下卻存在著無法解釋的缺陷。

如下面這樣一個博弈。兩個博弈方A、B輪流進行策略選擇，可供選擇的策略有「合作」和「不合作」兩種。規則是：A、B兩次決策為一組，第一次若A決策結束，A、B都得n,第二次若B決策結束，A得n-1而B得n+2;下一輪則從A、B都得n+1開始。假定A先選，然後是B,接著是A，如此交替進行。A、B之間的博弈次數為一有限次，比如198次。如圖13-1所示。

由於這個博弈的擴展形很像一條娛蚣，因此被稱為「蜈蚣博弈」。

現在的問題是：A、B是如何進行策略選擇的？我們用一對情侶之間的愛情博弈來說明。

圖13-1 蜈蚣博弈

愛情就其本質來說是一種交往，人交往的目的在於個人效用最大化，不管這個效用是金錢，還是愉快的感覺、幸福的感覺。只要追求個人效用，就必定存在利益博弈。因而，我們的愛情交往是一個典型的雙人動態博弈過程，不過愛情的效用隨著交往程度的加深和時間推移有上升趨勢。

假定小麗(女)和小冬(男)是這個蜈蚣博弈的主角，這個博弈中他們每人都有兩個戰略選擇，一是繼續，一是分手。他們的博弈展開式如圖13-2所示。

圖13-2愛情博弈

在圖中，博弈從左到右進行，橫向連桿代表繼續交往戰略，豎向連桿代表離開她(他)戰略。每個人下面對應的括號代表相應的人與對方分手，導致愛情結束後各自的愛情效用收益。括號內左邊的數字代表小麗的收益，右邊代表小冬的收益。

可以看到，小冬和小麗的分手戰略分別對應的括號數字每個都不同，這是因為愛情效用在不斷增加，這裡假設愛情每繼續一次總效用增加1，如第一個括號中總效用為1+1=2,第二個括號則為0+3=3,只是由於選擇分手戰略的人不同，而在兩人之間進行分配。由於男女生理結構和現實因素不同，小麗分手戰略只能使效用在二人之間平分，即兩敗俱傷；小冬選擇分手戰略則能佔到3個便宜。顯然，分手對於被甩的一方來說是一種欺騙行為。

請看，首先，交往初期小麗如果甩了小冬，則兩人各得1的收益，小麗如果選擇繼續，則輪到小冬選擇。小冬如果選擇分手，則小麗屬受騙，收益為0,小冬佔了便宜收益為3,這樣完成一個階段的博弈。可以看到每一輪交往之後，雙方瞭解程度加深，兩人愛情總效用在不斷增長。這樣一直博弈下去，直到最後兩人都得到10的圓滿收益，為大團圓的結局——總體效益最大。

遺憾的是這個圓滿結局很難達到！因為娛蚣博弈的特別之處是：當A決策時，他考慮博弈的最後一步即第100步；B在「合作」和「背叛」之間做出選擇時，因「合作」給B帶來100的收益，而「不合作」帶來101的收益，根據理性人的假定，B會選擇「背叛」。但是，要經過第99步才到第100步，在第99步，A的收益是98,A考慮到B在第100步時會選擇「背叛」，那麼在第99步時，A的最優策略是「背叛」——因為「背叛」的收益99大於「合作」的收益98……按這樣的邏輯推論下去，最後的結論是令人悲傷的：在第一步A將選擇「不合作」，此時各自的收益為1!

把這種分析代人上面的愛情博弈當中，我們可以發現，當雙方博弈到達如果分手小麗可得收益為10的階段，小冬是很難有動力繼續交往下去，繼續下去不但收益不會增長，而且有被小麗甩掉反而減少收益的風險。小麗則更不利，因為她從來就沒有佔先的機會，她無論哪次選擇分手策略，都是兩敗俱傷，而且還有可能被小冬欺騙而減少收益。在愛情過程中，女人總體來講處於不利地位。因此，每一次交往，無論小冬還是小麗都有選擇分手來中止愛情的動機，更詳細的數學可以證明，愛情圓滿的結局不可能達到。當然，我們在生活中會發現，踏人婚姻殿堂的情侶數量，並不像上面的推論得出的那樣令人絕望。這是怎麼回事呢？

從邏輯推理來看，倒推法是嚴密的，但結論是違反直覺的。直覺告訴我們，一開始就採取不合作的策略獲取的收益只能為1，而採取合作性策略有可能獲取的收益為100。當然，A—開始採取合作性策略的收益有可能為0,但1或者0與100相比實在是太小了。直覺告訴我們採取合作策略是好的。而從邏輯的角度看，一開始A應取不合作的策略。我們不禁要問：是倒推法錯了，還是直覺錯了？這就是蜈蚣博弈的悖論。

對於蜈蚣悖論，許多博弈專家都在尋求它的解答。西方博弈論專家通過實驗發現，不會出現一開始選擇「不合作」策略而雙方獲得收益1的情況。雙方會自動選擇合作性策略。這種做法違反倒推法，但實際上雙方這樣做，要優於一開始就採取不合作的策略。

倒推法似乎是不正確的。然而我們會發現，即使雙方開始能走向合作，即雙方均採取合作策略，這種合作也不會堅持到最後一步。理性的人出於自身利益的考慮，肯定會在某一步採取不合作策略。倒推法肯定在某一步，要起作用。只要倒推法在起作用，合作便不能進行下去。

也許下面這個觀點顯得更為公允：倒推法悖論的產生其實是源於其適用範圍的問題，即倒推法只是在一定的條件下和一定的範圍內有效。忽略了這一點，籠統去談論倒推法的有效性是不科學的。

倒推法的成立是有條件的，在一定的條件下它成立的概率比較高。由於倒推法在邏輯上和現實性方面都是有條件成立的，因此它的分析預測能力就有局限性，它就不可能適用於分析所有動態博弈；如果不恰當地運用了倒推法，就會造成矛盾和悖論。同時，我們也不能因為倒推法的預測與實際有一些不符，就否定它在分析和預測行為中的可靠性。只要分析的問題符合它能夠成立的條件和要求，倒推法仍然是一種分析動態博弈的有效方法。