讀古今文學網 > 博弈論的詭計:日常生活中的博弈策略 > 蜈蚣博弈的悖論 >

蜈蚣博弈的悖論

        一個人打算向鄰居借斧子,但又擔心鄰居不肯借給他,於是他在前往鄰居家的路上不斷胡思亂想:「如果他說自己正在用怎麼辦?」「要是他說找不到怎麼辦?」想到這些,這人自然對鄰居產生了不滿:「鄰里之間應該和睦相處,他為什麼不肯借給我?」「假如他向我借東西,我一定會很高興地借給他。」「可是他不肯借斧頭給我,我對他也不應該太客氣」……

        這人一路上越想越生氣,於是等到敲開鄰居的門後,他沒有說「請把你的斧子借給我用一下吧」,卻張嘴說道:「留著你的破斧子吧,我才不稀罕你的東西!」

        從上面這個笑話中,可以想像一些喜歡以己度人者在生活中遇到的尷尬。但是笑過之後,我們卻發現,這個借斧頭的人所運用的思維方法,居然有著倒推法的影子。

        難道倒推法真的有什麼問題嗎?答案是肯定的,這種悖論在博弈論中被稱為「蜈蚣博弈悖論」。很多學者已經用科學的方法推導出:倒推法是分析完全且完美信息下的動態博弈的有用工具,也符合人們的直覺,但是在某種情況下卻存在著無法解釋的缺陷。

        如下面這樣一個博弈。兩個博弈方A、B輪流進行策略選擇,可供選擇的策略有「合作」和「不合作」兩種。規則是:A、B兩次決策為一組,第一次若A決策結束,A、B都得n,第二次若B決策結束,A得n-1而B得n+2;下一輪則從A、B都得n+1開始。假定A先選,然後是B,接著是A,如此交替進行。A、B之間的博弈次數為一有限次,比如198次。如圖13-1所示。

        由於這個博弈的擴展形很像一條娛蚣,因此被稱為「蜈蚣博弈」。

        現在的問題是:A、B是如何進行策略選擇的?我們用一對情侶之間的愛情博弈來說明。

圖13-1 蜈蚣博弈

        愛情就其本質來說是一種交往,人交往的目的在於個人效用最大化,不管這個效用是金錢,還是愉快的感覺、幸福的感覺。只要追求個人效用,就必定存在利益博弈。因而,我們的愛情交往是一個典型的雙人動態博弈過程,不過愛情的效用隨著交往程度的加深和時間推移有上升趨勢。

        假定小麗(女)和小冬(男)是這個蜈蚣博弈的主角,這個博弈中他們每人都有兩個戰略選擇,一是繼續,一是分手。他們的博弈展開式如圖13-2所示。

圖13-2愛情博弈

        在圖中,博弈從左到右進行,橫向連桿代表繼續交往戰略,豎向連桿代表離開她(他)戰略。每個人下面對應的括號代表相應的人與對方分手,導致愛情結束後各自的愛情效用收益。括號內左邊的數字代表小麗的收益,右邊代表小冬的收益。

        可以看到,小冬和小麗的分手戰略分別對應的括號數字每個都不同,這是因為愛情效用在不斷增加,這裡假設愛情每繼續一次總效用增加1,如第一個括號中總效用為1+1=2,第二個括號則為0+3=3,只是由於選擇分手戰略的人不同,而在兩人之間進行分配。由於男女生理結構和現實因素不同,小麗分手戰略只能使效用在二人之間平分,即兩敗俱傷;小冬選擇分手戰略則能佔到3個便宜。顯然,分手對於被甩的一方來說是一種欺騙行為。

        請看,首先,交往初期小麗如果甩了小冬,則兩人各得1的收益,小麗如果選擇繼續,則輪到小冬選擇。小冬如果選擇分手,則小麗屬受騙,收益為0,小冬佔了便宜收益為3,這樣完成一個階段的博弈。可以看到每一輪交往之後,雙方瞭解程度加深,兩人愛情總效用在不斷增長。這樣一直博弈下去,直到最後兩人都得到10的圓滿收益,為大團圓的結局——總體效益最大。

        遺憾的是這個圓滿結局很難達到!因為娛蚣博弈的特別之處是:當A決策時,他考慮博弈的最後一步即第100步;B在「合作」和「背叛」之間做出選擇時,因「合作」給B帶來100的收益,而「不合作」帶來101的收益,根據理性人的假定,B會選擇「背叛」。但是,要經過第99步才到第100步,在第99步,A的收益是98,A考慮到B在第100步時會選擇「背叛」,那麼在第99步時,A的最優策略是「背叛」——因為「背叛」的收益99大於「合作」的收益98……按這樣的邏輯推論下去,最後的結論是令人悲傷的:在第一步A將選擇「不合作」,此時各自的收益為1!

        把這種分析代人上面的愛情博弈當中,我們可以發現,當雙方博弈到達如果分手小麗可得收益為10的階段,小冬是很難有動力繼續交往下去,繼續下去不但收益不會增長,而且有被小麗甩掉反而減少收益的風險。小麗則更不利,因為她從來就沒有佔先的機會,她無論哪次選擇分手策略,都是兩敗俱傷,而且還有可能被小冬欺騙而減少收益。在愛情過程中,女人總體來講處於不利地位。因此,每一次交往,無論小冬還是小麗都有選擇分手來中止愛情的動機,更詳細的數學可以證明,愛情圓滿的結局不可能達到。當然,我們在生活中會發現,踏人婚姻殿堂的情侶數量,並不像上面的推論得出的那樣令人絕望。這是怎麼回事呢?

        從邏輯推理來看,倒推法是嚴密的,但結論是違反直覺的。直覺告訴我們,一開始就採取不合作的策略獲取的收益只能為1,而採取合作性策略有可能獲取的收益為100。當然,A—開始採取合作性策略的收益有可能為0,但1或者0與100相比實在是太小了。直覺告訴我們採取合作策略是好的。而從邏輯的角度看,一開始A應取不合作的策略。我們不禁要問:是倒推法錯了,還是直覺錯了?這就是蜈蚣博弈的悖論。

        對於蜈蚣悖論,許多博弈專家都在尋求它的解答。西方博弈論專家通過實驗發現,不會出現一開始選擇「不合作」策略而雙方獲得收益1的情況。雙方會自動選擇合作性策略。這種做法違反倒推法,但實際上雙方這樣做,要優於一開始就採取不合作的策略。

        倒推法似乎是不正確的。然而我們會發現,即使雙方開始能走向合作,即雙方均採取合作策略,這種合作也不會堅持到最後一步。理性的人出於自身利益的考慮,肯定會在某一步採取不合作策略。倒推法肯定在某一步,要起作用。只要倒推法在起作用,合作便不能進行下去。

        也許下面這個觀點顯得更為公允:倒推法悖論的產生其實是源於其適用範圍的問題,即倒推法只是在一定的條件下和一定的範圍內有效。忽略了這一點,籠統去談論倒推法的有效性是不科學的。

        倒推法的成立是有條件的,在一定的條件下它成立的概率比較高。由於倒推法在邏輯上和現實性方面都是有條件成立的,因此它的分析預測能力就有局限性,它就不可能適用於分析所有動態博弈;如果不恰當地運用了倒推法,就會造成矛盾和悖論。同時,我們也不能因為倒推法的預測與實際有一些不符,就否定它在分析和預測行為中的可靠性。只要分析的問題符合它能夠成立的條件和要求,倒推法仍然是一種分析動態博弈的有效方法。