讀古今文學網 > 博弈論的詭計:日常生活中的博弈策略 > 帶劍的契約才有效 >

帶劍的契約才有效

        在每一個鼓勵合作的方案裡,通常都會包含某種懲罰作弊者的機制。

        一個坦白且供出合作夥伴的囚徒可能遭到對方朋友的報復。若是知道外面會有什麼報應等著自己,盡快逃脫牢獄之災的前景也就不會顯得那麼誘人了。人人都知道,警察會威脅毒品販子說如果不坦白就要釋放他們。這種威脅的作用在於,一旦他們被釋放,賣毒品給他們的人就會認定他們一定是招供了而加以報復。

        在最初博弈之上增加懲罰機制的做法,其目的就是為了減少作弊的動機。在博弈的結構裡還存在其他類型的懲罰。一般而言,這種機制生效的原因在於博弈反覆進行,這一回合作弊所得將導致其他回合所失。

        歸納起來,在一次性的博弈當中沒有辦法達成互惠合作。只有在一種持續的關係中才能夠體現懲罰的力度,並因此成為督促合作的「木棒」。合作破裂自然就會付出代價,這一代價會以日後損失的形式出現。假如這個代價足夠大,作弊就會受到遏制,合作就會繼續。事實上,法國哲學家盧梭早就指出了這一點,他曾經有一本《社會契約論》,認為契約是整個人類社會存在的前提條件之一。

        前面已經分析過,如果囚徒困境只是一次性的博弈,那麼簽訂協議是毫無意義的,其納什均衡點並不會改變。可以簽訂協議的一個最基本的條件,就是博弈需要重複若干次,至少大於一次。

        重複博弈與一般性的動態博弈是不同的。多輪動態博弈中,參與者能夠瞭解到博弈的每一步中其他參與者的在自己選擇某種策略下的行動,而重複博弈的參與者無法瞭解到在任何一步中,其他參與者的策略選擇。

        在重複型的囚徒困境中,簽訂合作協議並不困難,困難的是協議對博弈各方是否具有很強的約束力。任何協議簽訂之後,博弈參與者都有作弊的動機,因為至少在作弊的這一輪博弈中,可以得到更大的收益。

        霍布斯對合作協議的觀點是:「不帶劍的契約不過是一紙空文。它毫無力量去保障一個人的安全。」這就是說,沒有權威的協議並不能導致民主,而是導致無政府狀態。

        囚徒困境擴展為多人博弈時,暴露了一個更廣泛的問題——「社會悖論」,或「資源悖論」。人類共有的資源是有限的,當每個人都試圖從有限的資源中多拿一點兒時,就產生了局部利益與整體利益的衝突。人口問題、資源危機、交通阻塞,都可以在社會悖論中得以解釋。在這些問題中,關鍵是制定遊戲規則來控制每個人的行為。

        另外,學者愛克斯羅德所著的《合作的進化》一書暗含著一個重要的假定,即個體之間的博弈是完全無差異的。但對局者之間絕對的平等是不可能達到的,因而某些博弈對一方來說是典型的高成本、低回報:一方面,對局者在實際能力上存在不對稱,雙方互相背叛時,可能不是各得1分,而是強者得5分,弱者得0分,這樣,弱者的報復就毫無意義;另一方面,即使對局雙方確實旗鼓相當,但某一方可能懷有賭徒心理,認定自己更強大,採取背叛的策略能佔便宜。愛克斯羅德的分析忽視了這種情形,而這種事實或心理上的不平等恰恰在社會上引發了大量零和與負和博弈。

        在這種情況下,應通過法制手段,以法律的懲罰代替個人之間的「一報還一報」,才能規範合作行為。事實上,從博弈論的角度看,法律就是通過第三方實施的行為規範,其功能是或者通過改變當事人的選擇空間改變博弈的結果,或者不改變博弈本身而改變人們的信念或對他人的行為預期,從而改變博弈的結果。