讀古今文學網 > 狡猾的情感:為何憤怒、嫉妒、偏見讓我們的決策更理性 > 第四章 博弈論、情感與道德金律[1] >

第四章 博弈論、情感與道德金律[1]

囚徒困境或許是各類社科文獻中遭到濫用最多的悖論。但無論是不是專業研究人員,但凡不小心中招落入其圈套的人,都會為之著迷。在等式中引入理性情感是否能幫助我們走出困境?

讓我們來簡要回顧一下囚徒困境的基本理論。兩名銀行搶劫嫌犯被抓獲,遭到了逮捕,但警方的證據不足,若兩人均不肯招供,警方將別無選擇,只能釋放他們。

兩名嫌犯被分別關在兩間單人牢房裡,審訊的警察將兩人輪流叫到審訊室,向他們提出以下方案:如果兩人中有一人招供,另一人拒絕招供,招供的人會被釋放,而拒絕招供的人會被判處5年徒刑;如果兩人都招供,則兩人都會被判刑,但坦白從寬,會酌情減刑,只會被判處4年徒刑;如果兩人都不招供,警方則無法控告他們有罪,只能控告他們在追捕過程中有危險駕駛行為,判處一個月的監禁。

兩名嫌犯須分別決定對此方案作何答覆,但沒有機會以任何方式同關在不同牢房的另一名嫌犯溝通。那麼,嫌犯是否會招供?

設身處地站在一名嫌犯的立場上思考,你會馬上發現無論對犯罪同夥的選擇有何判斷,招供始終符合你的最佳利益:如果對方招供,你也招供,你的刑期可以減少一年(從5年減到4年);如果對方拒絕招供,你招供就能立即得到釋放,獲得自由。

然而,這一結論自相矛盾:若兩名嫌犯都從理性和自私的角度思考,認為自己應該認罪,兩人都會被判處4年徒刑;如果兩人都拒絕招供,他們的境遇會好得多,只需服短短一個月的刑期。

囚徒困境並非打發時間的智力遊戲,而是博弈論的一個核心概念。博弈論,本質上就是對交互決策的研究。「博弈」作為專業術語,意即一人的行為會影響另一人處境的任何情況。經濟競爭、國與國的暴力衝突乃至家庭內部的互動都可以利用博弈論來建立模型。

社會科學研究者往往將囚徒困境稱為社會困境博弈,因其言簡意賅地描述了各種各樣的社會與經濟情況,包括環境污染、偷稅漏稅、逃避兵役,乃至在銀行插隊。在以上所有案例中,從單個個體的角度考慮,都存在一項更加可取的行為。然而,假如所有(或退一步講,大多數)參與者都做出這一行為,所有人都會深受其害。那麼,在現實世界中,我們應如何解決此類困境?既然無法強制人們合作,人們又為何會選擇合作?

針對這一問題,羅伯特·奧曼在一系列研究論文中給出了答案,憑借這些論文,他獲得了2005年諾貝爾經濟學獎(當年的諾貝爾經濟學獎由奧曼與謝林共同獲得)。囚徒困境的社會變異往往是「重複博弈」,即同一種互動情景在同一組參與者之間多次重複進行。由於是重複進行,選擇自私而為或會造成不小的損失:人們會記得你過往的行徑。因此,自私而為的參與者(如在典型的囚徒困境中選擇招供的人)再次遇到同樣的情形時,其他參與者可能會伺機報復,從而也選擇只符合其一己私利的行為(如自己選擇招供)。

奧曼建立了重複博弈的數學模型,證明了在重複博弈的情形中,經過理性思考而達成合作是有可能的。(奧曼的理論本身值得充分討論,下一章會予以詳述。)然而,根據我本人的研究,還有另一種可能的答案。理解這一答案,需要先介紹一下博弈論的核心概念之一:納什均衡——這一理論以1994年的諾貝爾經濟學獎獲得者約翰·納什命名,納什作為電影《美麗心靈》[2]的主角原型而聞名世界,其萌生均衡概念的靈感是在20世紀50年代初——納什均衡最終成為極為重要的概念,廣泛用於社會科學領域。

為解釋納什均衡所蘊含的思想,我們要重點探討涉及兩名參與者的博弈:每名參與者均有多項行為(或策略)可以採取,從可選行為中選擇一項行為,所選行為決定著兩人的收益。如兩名參與者所選的行為均為另一人所選行為的「最佳回應」,均衡即形成。換言之,兩名參與者若選擇其他行為,收益不會增加。

試舉一個更為具體的例子,設想一種名為兩性之爭的博弈:你和你的伴侶需要決定今晚去哪裡過。

選項有兩個,一是芭蕾舞劇,一是拳擊比賽。不巧的是,對於如何選擇,你和你的伴侶存在很大分歧:你堅決要在晚上看芭蕾舞,而你的伴侶卻不肯放棄欣賞一場精彩拳擊比賽的機會。

多番協商無果後,你們決定通過以下方式確定選哪個。你們兩人各拿一張紙條,在上面寫下「芭蕾」或「拳擊」,不能看對方寫了什麼,也不能和對方討論這件事。七點整,你們將紙條交給鄰居布朗先生,布朗先生隨後會大聲宣讀紙條上的內容:如果兩人針對晚上的活動寫下了同樣的內容,你們就要一起參加這項活動;假如你們寫了不同的活動,你們兩人都只能留在家裡,錯過晚上出去玩的機會。現在假設你們每人都將自己首選的活動估價為200美元,次選的活動估價為100美元,留在家裡是最差的選擇,可估價為0美元。在這一博弈中,怎樣才算均衡狀態?

只有兩人都寫「芭蕾」或兩人都寫「拳擊」,均衡狀態才可形成。如果兩人固執己見,都寫了自己的首選活動,你們只能雙雙留在家裡。由此可見,改善境況的唯一方式就是一人做出讓步,同意參加自己的次選活動,但這正是該例中的「圈套」所在:假如你和你的伴侶都決定委曲求全,成全對方的喜好,你們也只能留在家裡(請記住,你們不能和對方討論寫什麼)。

這對夫妻能增加選擇同一活動,從而確保晚上能出去的概率嗎?當然可以!例如,拳擊迷可以在餐桌上放一隻拳擊手套,明確暗示對方自己不計後果,絕不會讓步,放棄自己的首選活動。這或許能讓芭蕾迷明白,除非他想在家過夜,否則就別無選擇,只能同意妻子的選擇,從而增加他在紙條上選「拳擊比賽」的概率。

另外,丈夫或許想先發制人,在客廳裡放柴可夫斯基的《天鵝湖》,暗示他無論如何也會堅持選擇芭蕾,從而增加妻子態度軟化,順從他在紙條上選「芭蕾」的概率。

在無法直接同對方溝通的情況下,這對夫妻確有可能通過此類暗示,來增加在兩性之爭的博弈中達成均衡狀態的概率。但這與情感有何關係?

實際上,情感就是一種信號傳遞機制,讓我們得以在日常參與的各類博弈中協調行動,達成均衡。情感還可以幫助我們建立新的均衡狀態,這種均衡在純粹的思維與理性世界中是不存在的。在很多情況下,情感可以通過這種機制改善我們的社會境遇。

為理解這一重要觀點,讓我們回到囚徒困境這一理論,證明即便博弈只進行一次,情感也可以建立起合作性均衡。為此,我們描述囚徒困境的方式略有不同。

假設你和一個素不相識的人參加一項實驗。首先,你們每人分到100美元。然後,你們要在兩種可能行為中二選一:「拿走」或「分享」(你們兩人在做出選擇之前,沒有機會討論如何選擇)。如果你們一人選擇拿走,一人選擇分享,選擇分享的人須將100美元全部送給選擇拿走的人。如果你們兩人都選擇拿走,則每人須返還50美元給實驗人員。最後,如果你們兩人都選擇分享,實驗人員會分別給每個人再發50美元,你們每人可以拿走150美元。

請注意,這種博弈與前一節提及的《平分或偷走》節目有相似之處。二者相同之處在於,如果你所在乎的僅僅是拿到最高的現金獎勵,你無論如何都應該選拿走。無論另一名參與者如何選擇,你選拿走得到的錢都更多。

下面在博弈中加入情感因素。假設在遊戲中,除了獲得金錢回報之外,對你來說有價值的還包括,一方面要做一個正人君子,另一方面也不能「任人蒙騙」。如果你選擇拿走,而另一名參與者選擇分享,你會因為自己的貪得無厭感到慚愧。這種羞恥感存在負價值,我們姑且將其描述為相當於損失掉100美元。相反,如果你選擇分享,而另一名參與者選擇拿走,你會感到惱羞成怒。姑且可以說,這種情緒也相當於損失100美元。如果你們兩人都選擇拿走或都選擇分享,你的情感反應則是不喜不悲。

現在假設另一名參與者在上述情況中也會產生完全相同的情感反應,且這些反應附帶的金錢價值完全一致,對此博弈的分析則會出現顯著變化。選擇拿走,原本最高可得200美元現金,現在則變成了100美元,因為你可以說羞恥感會造成損失。新的價值低於選擇分享的所得,意即你最理想的情況就是拿到150美元。因此,兩名參與者同時選擇分享成了新的均衡模式,即最有可能出現的情況是雙方都選擇合作,而非自私而為。

簡而言之,這說明在這一等式中,情感——甚至包括憤怒和羞恥等消極情感——的存在可以提高兩名參與者的最終所得。然而,這一解釋並不完整。我想證明,上例中描述的情感並不是隨機挑選的,而且實際上,這些情感切合有此情感之人最狹隘的物質利益。

假設有情感反應的參與者也能較為準確地預測到他人的情感反應。接下來,假設囚徒困境博弈中有一名參與者是個沒有感情的人,凡事皆做最冷漠無情的思考,一心只謀求拿到最多的金錢收益,而另一名參與者有著前文所述的正常情感反應(及情感預測能力)。請試想一下,這種情況會造成什麼樣的結局。姑且將鐵石心腸、精於算計的參與者稱為「頭腦先生」,而另一名參與者則為「情感先生」。

頭腦先生自然會選擇拿走,因為他不知羞恥。但情感先生很可能明白自己面對的是頭腦先生,進而推斷出頭腦先生會選拿走。在此情況之下,如果情感先生選擇分享,他會承受雙重損失:一是他在博弈開始時拿到的100美元會被收回,二是他會覺得自己受到了羞辱,相當於再次損失了100美元,損失合計200美元。反之,如果他選擇拿走,他只會損失50美元。情感先生因此認定,他也應該選拿走,這樣他和頭腦先生得到50美元,這與兩名參與者都有感情的情況截然相反。上文已證明,這種情況可達到兩人皆得150美元的均衡狀態。結論是,情感行為有其益處:在這一簡單的例子中,情感反應能在金錢方面構成正面優勢。

該例來自我所建立的一個數學模型,該模型歸納了納什均衡的概念。該模型表明,在許多類似囚徒困境的博弈中,合作的主要動機是追求互惠互利的情感需求。例如,在別人都慷慨相贈的情況下,自己因表現出貪慾而產生了羞恥感,或者別人貪得無厭時,自己會感到羞憤交加,這兩種情感共同組成了道德金律,亦稱互惠倫理。

道德金律在宗教典籍中受到了大肆的宣揚,所有小學生都要習得此道,以此種手段來保護他人的情感,即某些事雖然有悖於你的個人私慾,你卻仍然要義不容辭,但這些實驗表明,道德金律也是滿足一己私利的重要手段。

[1]道德金律,即互惠倫理。這一術語的使用可追溯至17世紀的歐洲,指的是《馬太福音》第七章第十二節和《路加福音》第六章第三十一節的論述,即「你們願意人怎樣待你,你們也要怎樣待人」。這一金律幾乎是世界通用的,因為許多國家的思想文化中都出現過類似的概念,如孔子的「己所不欲,勿施於人」。——譯者注

[2]《美麗心靈》,約翰·納什的傳記片,改編自同名傳記,由好萊塢演員拉塞爾·克勞主演,上映於2001年,並獲得2002年奧斯卡最佳影片與最佳導演獎。——譯者注