讀古今文學網 > 石頭剪刀布博弈心理學 > Chapter 3 第三章 各種靜態博弈 >

Chapter 3 第三章 各種靜態博弈

在靜態博弈中,我們無法事先瞭解對方的策略,但還不得不思考自己的策略。在這一章中,我們將通過博弈論中具有代表性的協調博弈和鬥雞博弈,來分析最優策略的選擇方法,以及這些理論在現實生活中的應用。

與對方協作,可以增加自己的收益

~協調博弈/相關策略~

在非合作博弈中,局中人會各自進行合理的判斷,為自己追求最大的收益。作為企業,會將價格設定得低於其他公司以吸引顧客;作為個人,會為了自己的利益選擇比對方更有利的策略。

然而,如果大家知道,和別人進行協調、協作的話,可以讓自己獲得更高的收益,那麼大家一定樂於進行協作。不過,有一點希望大家牢記:協調博弈屬於非合作博弈。為什麼屬於非合作博弈呢?因為在協調博弈中,局中人之間並不是經過相互協商達成一致後再採取行動的,最多只是根據對方的行為適當調整自己的行為,因此屬於非合作博弈。

生活中協調博弈的例子,比較典型的就是汽車通過十字路口。假設兩輛汽車從相互垂直的兩個方向開來,同時抵達十字路口,如果都繼續向前開,那麼肯定會相撞。如果知道對方會停下來避讓,只要繼續直行就好了;如果知道對方不會停下來,只有自己停下來避讓,才不會發生事故。在這種情況下,如果隱藏自己的意圖或者一意孤行,對自己絕對沒有好處。所以,雙方應該相互協調,調整各自的行為。

在這個博弈中,納什均衡應該是「自己停下來避讓,讓對方先通過路口」和「對方停下來避讓,自己先通過路口」。不過,雖說納什均衡是最優的策略組合,但要瞬間判斷該選擇哪個納什均衡,我們是做不到的。所以,路口才會設置紅綠信號燈。信號燈就是協調交通參與者行為的一種設備,紅綠燈以一定的頻率交替變換,告訴交通參與者什麼時候該停止,什麼時候該前進,以幫助交通參與者選擇納什均衡。像這樣,局中人通過共同觀察到的情況做出決定,叫作「相關策略」。相關策略的組合達成納什均衡的,就叫作「相關均衡」。

從《麥琪的禮物》看夫妻間的協調

~協調博弈/收益值變了,博弈就變了~

美國著名小說家歐·亨利有一部代表作名叫《麥琪的禮物》,其中講述的故事也是協調博弈的一種。

有一對貧窮的夫婦,聖誕節快到了,他們都想給對方買一份稱心如意的聖誕禮物,但是誰都沒有什麼積蓄。妻子為了給丈夫心愛的懷表配一條表鏈,賣掉了自己視若珍寶的長髮。而丈夫為了給妻子買梳理秀髮的梳子,典當了自己的懷表。因為彼此的感情非常深厚,都想給對方最好的禮物,結果陰差陽錯,夫婦倆苦心為對方準備的禮物都變成了無用的東西。但換個角度看,其實,雙方都收穫了比禮物更珍貴的東西,那就是愛。這是一個溫暖人心的感人故事。

我們姑且設定,妻子賣掉頭髮、丈夫當掉懷表的收益都是3(因為可以買禮物送給心愛的人);收到對方送的禮物,收益得分為5(心愛的人送自己禮物,當然很開心);沒有了長髮卻收到梳子、沒有了懷表卻收到表鏈,兩人的收益得分都為-5。據此,我們製作出一張收益表。從表中我們可以看出,在這個博弈中,夫妻雙方的最優反應,即納什均衡是「丈夫不當懷表,妻子賣掉頭髮」和「丈夫當掉懷表,妻子不賣頭髮」。

這個博弈中的兩個局中人,即夫妻雙方,不經協調就採取行動,結果的收益都是負數。因為事先並沒有向對方表明自己的意圖,所以最終得到了略感遺憾的結局。事先不進行溝通,當然可能給對方帶來驚喜,但也可能造成遺憾,這就是協調博弈的風險。

在《麥琪的禮物》這個故事中,雖然結局有些遺憾,但是,雙方都收穫了比任何珍寶都更寶貴的東西,那就是彼此的愛情和自我犧牲的精神。也許,這種精神上的收益讓他們更有幸福感。所以,如果認為精神上的收益高於物質收益,這個博弈的收益將發生很大的變化。

為了獲得收益,應該選擇協作還是單獨行動?

~獵鹿博弈/如何讓對方與自己協作~

18世紀著名的社會哲學家盧梭給人們講了一則「獵鹿」的寓言。現在,我們從博弈論的角度來分析一下這則寓言,也許其中的道理就更容易理解了。

那個時候,獵人想獵捕一頭鹿,需要多人進行合作。如果捕到一頭大鹿,每人分到的戰利品會多一些,但並不是每次都能成功。合作獵鹿需要做嚴密的分工,有人負責追趕鹿,有人負責設置陷阱,有人則用弓箭射鹿……總之,參與獵鹿的人都必須嚴守自己的崗位,盡自己最大的努力。但是,假設在追趕鹿的過程中遇到一隻兔子,該怎麼辦呢?獵人可以很輕鬆地捕獲一隻兔子,此時,這個獵人是該放棄追鹿去捕兔子,還是放棄兔子繼續追鹿呢?停下來捕捉兔子的話,100%可以得手,只是收益小了點兒;繼續追鹿的話,可能獲得更大的收益,但也可能失敗,一無所獲。

我們假設這個獵鹿博弈中有兩名獵人參與,這兩名局中人的收益如表3-1所示。兩個獵人分別去捕捉兔子的話,各自的收益是1;如果協作捕鹿的話,各自的收益是2。而且,只有兩個人協作才能捕到鹿。如果一個人想去捕鹿,但得不到另外一個人的協助的話,也捕不到鹿,最後的收益是0。從收益表中我們可以看出,這個博弈的納什均衡是「鹿、鹿」組合和「兔、兔」組合。這個博弈就叫作「獵鹿博弈」,是協調博弈的一種。只有局中人相互協作,才能提高各自的收益。分工獵鹿,是獵人之間不成文的約定,對獵人的行為並沒有實際的約束力,因此這也算一種非合作博弈。

如果獵人能夠按照最初的目的繼續追趕鹿,最終可以獲得最大的收益。但是,有些獵人可能會因為擔心合作夥伴的能力、追趕的鹿太過強壯等原因,認為繼續追鹿的選擇是不合理的,就難以抵擋住路邊兔子的誘惑。還有一種情況是有些獵人不信任自己的夥伴,懷疑對方也會中途停下來捉兔子,於是自己也放棄追鹿,去捉兔子。為了不讓自己被這種誘惑打敗,信任合作夥伴,相信他會堅持追鹿,也是合作的一個必要條件。所以,在酒館裡,獵人們經常會吹噓自己的打獵手段多麼高明,戰利品多麼豐富,其實,這並不全是為了滿足自己的虛榮心,也是為了讓其他獵人相信自己的打獵水平,以後合作的時候,也好讓合作夥伴安心地繼續去追鹿。

此外,獵人不會去理兔子而是專心追鹿,這也可能是因為捕鹿的收益特別大,或者捉兔子的收益非常小。關於這種情況,我們將在下一小節的例題中講到。

如果得到了公司的內幕消息,你會怎麼做?

~知情博弈/對方值得信任嗎?~

假如你得到一個內幕消息,說公司近期要收購某家公司。倘若如此,被收購公司的股價可能會迅速上漲。這時,你會怎麼做呢?

被收購公司的股價將會上漲,那麼現在你肯定想購買這家公司的股票,以期大賺一筆。但是,這樣一來,就屬於內幕交易,會觸犯法律。如果你把這個消息悄悄告知自己的父母、妻子、兄弟等親密的人,讓他們購買該公司的股票,那麼日後如果遭到調查,你也脫不掉洩露內幕消息的干係。此時,假設你要和關係不太親密的朋友合謀,購買那家公司的股票牟利。在此前提下,如何把握和這個朋友之間的親疏關係,就成了你煩惱的來源。很親近的朋友倒是可以信賴,但是和親密朋友合謀幹這種勾當,容易被別人識破;如果是不太親近的朋友,你又不敢完全信任對方。如果他愛吹牛,說不定哪天就把這個消息洩漏了,讓第三者聽到,你就可能要承擔很大的責任。以此為例只是要說明在知情博弈中你會面臨的關於信任的選擇難題。我們是絕對反對股票內幕交易的。

協調博弈,是局中人相互協調,然後獲得等同的收益。這種博弈也可以稱為信任博弈,博弈的解要麼是雙方都獲得很大的收益,要麼是雙方都平安無事,只獲得很小的收益,甚至沒有收益。

在這樣的信任博弈中,對方是否值得信任很重要。必須要讓對方認識到,他通過納什均衡獲得的收益,要遠遠高於他背叛你時的收益。

在膽量測試中,如何取勝?

~鬥雞博弈/通過操縱策略來取得博弈的勝利1~

基本上來說,男人都是膽小鬼。可是,膽小鬼們卻喜歡玩什麼「鬥雞博弈」,以此來炫耀自己的膽量。現在,我們用博弈論來分析一下鬥雞博弈。

◎例題3-1鬥雞博弈

你的朋友中有一個特別喜歡裝硬漢的傢伙,而且平時你們兩人就看對方不太順眼。於是有一天,你們決定比一比誰的膽量大。比試的規則很簡單,就是在一條筆直的路上,你們兩個駕駛汽車高速對向行駛。當兩輛汽車越來越近的時候,看誰先打方向盤,誰先轉向誰就輸了,會被嘲笑為「懦夫」。在這個博弈中,局中人既想顯示自己膽量大,又不想撞車受重傷。那麼,你採取的策略是「直行」還是「轉向」?最佳的策略到底是什麼呢?

在這個博弈中有兩種策略,分別是「直行」和「轉向」。這兩個策略的收益比較起來不是很直觀,所以我姑且先把它們數值化。如果兩人都堅持「直行」,結果撞車,兩人都受重傷,各自的收益得分都是-10。如果你堅持「直行」,而對方因為害怕提前轉向了,那麼你贏得了大膽的好名聲,收益得分為5,同時,對方被罵為懦夫,收益得分是-5。反過來,如果對方堅持「直行」而你「轉向」,那你的收益得分就是-5,對方是5。如果雙方都提前「轉向」,那都會被認為是膽小鬼,雙方的收益得分都是-1。

我們先來找找這個博弈中有沒有支配性策略,如果沒有的話,就從最優反應中尋找納什均衡。

~鬥雞博弈/通過操縱策略來取得博弈的勝利2~

我們從收益表中尋找最優反應。如果對方堅持「直行」,那麼你也「直行」的話,收益得分是-10,如果你「轉向」的話,收益得分是-5,所以應該選擇「轉向」。我們將較低的得分-10用橫線勾掉。如果對方選擇「轉向」的話,你堅持「直行」可以得到5分,如果你也「轉向」的話,只能得到-1分,所以這種情況下,你應該選擇「直行」。我們將較低的得分-1用橫線勾掉。

同樣,當你選擇「直行」的時候,對方「直行」得-10分,他「轉向」得-5分,所以他應該選擇「轉向」。我們將較低的得分-10用橫線勾掉。如果你選擇「轉向」的話,那麼對方選擇「直行」得5分,選擇「轉向」得-1分,所以他應該選擇「直行」。我們將得分較低的-1用橫線勾掉。

從收益表中我們可以看出,這個博弈中沒有支配性策略。沒有被橫線勾掉數字的小格還剩兩個,這兩個就是納什均衡,也就是這個博弈的解(表3-3)。

這個博弈的解為:

你「直行」,對方「轉向」和你「轉向」,對方「直行」。

當一個博弈中,納什均衡不止一個的時候,在均等的條件下,我們無法用理論來判斷到底該選哪一個。不過,對於你來說,當然是「你『直行』,對方『轉向』」的策略組合讓你收益更高。不過,在這個博弈中,有一招能保證你必勝。

~鬥雞博弈/通過操縱策略來取得博弈的勝利3~

在這個鬥雞博弈中,你的必勝方法其實很簡單,就是在兩車快要相撞的時候,你把自己汽車的方向盤拔下來。

沒有了方向盤,你的汽車就無法轉向了。即使想轉向,也毫無辦法。如果只是雙手離開方向盤,那麼也可能因為害怕又抓住方向盤轉向。

你的汽車失去了方向盤,只能直行,如果對方不轉向的話,結果只能是兩車相撞。怕死的對方一定會轉向。因為你已經表現出了「絕不避讓」的堅定決心,這一招能讓對方感覺到實實在在的威脅。

你把方向盤拔下來的那一瞬間,你就放棄了「逃避」的選項。結果,整個博弈就只剩一個納什均衡了,那就是兩車相撞。在這種情況下,對方為了採取最優反應,只有選擇轉向避讓。結果,你贏得了這場博弈。

像這種,自己拋棄一些選項,向對方顯示自己的強烈意志和堅定決心的策略,和序章(第6頁)中介紹的「捨棄重要事物的『破釜沉舟』戰略」如出一轍。兩者都是通過操縱策略,讓博弈朝著更有利於自己的方向發展。

除了拔掉方向盤的策略之外,還有一種方法可以取勝,就是讓對方覺得你神志不太正常。這樣一來,博弈也會對你有利。如果讓對方覺得你這個人非常理智,他就會想,理智的人一般都不太願意冒險,所以他反倒會大膽起來。如果一開始你就做出一些莫名其妙的行為來迷惑對方,讓他覺得「這個人什麼事都幹得出來」,那麼,在博弈中他就會害怕你,從而提前轉向。

古巴導彈危機中肯尼迪總統的策略

~政治界的鬥雞博弈1~

鬥雞博弈不僅僅出現在個人與個人的膽量較量上,還有國家與國家之間的較量。20世紀冷戰時期,美國與蘇聯的「古巴導彈危機」就是鬥雞博弈的典型案例。

1962年,美國獲得情報稱,蘇聯在古巴建設了中程導彈基地。從地理上來看,古巴是美國的鄰居,而蘇聯在古巴建立了中程導彈基地,無異於在美國後院安放了一枚定時炸彈,給美國帶來了巨大的軍事威脅。當時,美國與蘇聯相比,不管是核武器的數量還是質量,都處於上風。而且,美國在蘇聯的鄰國土耳其也設有軍事基地。在這種情況下,美國總統肯尼迪決定對古巴進行海上封鎖,借此脅迫蘇聯撤除其在古巴的導彈基地。而蘇聯方面,表面上矢口否認自己在古巴設有導彈基地,但又秘密向古巴運送核武器。不僅如此,還有一架美國偵察機被蘇軍擊落。當天,美國甚至考慮攻擊蘇聯的潛水艇進行報復。但是,蘇聯的潛水艇上可能搭載有核導彈。這時,如果兩國首腦做出一個錯誤選擇,就有可能引發第三次世界大戰。在這樣千鈞一髮的時刻,美國是該攻擊蘇聯在古巴的導彈基地,還是避免發起攻擊,解除對古巴的海上封鎖呢?我們利用博弈論的知識來分析一下雙方的策略和收益。

雙方的策略有「攻擊」和「迴避」兩項。如果美蘇雙方都選擇攻擊,那麼第三次世界大戰在所難免,將會給雙方乃至全世界帶來無可估量的損失。我們將這種情況下雙方的收益都設定為-100。如果雙方都選擇「迴避」,和平解決危機,那麼雙方的收益都是2。如果美國選擇「攻擊」而蘇聯選擇「迴避」,那麼美國的收益是3,蘇聯的收益是1。反過來,如果蘇聯選擇「攻擊」而美國選擇「迴避」,那麼蘇聯的收益是3,美國的收益是1。

註:1日語中「洗滌」和「選擇」同音。

~政治界的鬥雞博弈2~

收益的大小,是根據相互之間的比例關係設定的,至於具體數值的大小,並不重要。

那麼,我們來為古巴導彈危機這個博弈製作一張收益表。從表中尋找美國和蘇聯的最優反應時,我們可以發現,這個博弈中存在兩個納什均衡。一個是「美國攻擊,蘇聯迴避」,另一個是「蘇聯攻擊,美國迴避」。這和兩個人比試膽量,開車對撞那個博弈中的情況是一樣的。

前面我已經講過,在鬥雞博弈中,讓對方知道自己絕不會撤退的堅定決心是非常重要的,這是一種強有力的威脅。當時,在核武器的數量、質量上都處於上風的美國,對於蘇聯保持著強硬態度,美國發現並監視了蘇聯的潛艇。最終,蘇聯沒有選擇反擊,在美國做出不入侵古巴的承諾後,撤除了在古巴的導彈基地。第三次世界大戰與我們擦肩而過。

實際上,在古巴已經存在蘇聯的短距離戰術核武器。但是,美國並沒有獲得這個情報。我覺得,如果蘇聯想以強硬態度逼迫美國做出讓步,也許應該把古巴擁有戰術核武器的情報透露給美國。另一方面,美國在土耳其配備的導彈其實已經十分老舊,此前美國正打算撤除這些導彈。但是,美國並沒有把這個情報透露出去,所以才能對蘇聯保持強硬的態度。

預防接種,誰是最大的獲益者?

~預防接種博弈/社會性的鬥雞博弈~

關於鬥雞博弈,前面介紹了個人與個人之間的博弈、國家與國家之間的博弈,其實,還有個人與眾人之間的博弈案例。以預防接種來說,個人接種了疫苗,可以防止感染相應的疾病,即使感染了,也不至於發展到十分嚴重的地步,這是接種疫苗的好處。但另一方面,接種疫苗也存在遭受不良反應以及副作用的風險。那麼,我們該不該接種疫苗呢?到底該如何衡量呢?

我們把預防接種比喻成一個博弈,你是一個局中人,另一個局中人是其他眾人。在這個博弈中,最差的狀態就像比試膽量遊戲中兩車相撞的結果一樣,你和其他人都沒有接種疫苗。雖然大家都不會受到疫苗副作用的影響,但大家都有可能感染疾病,甚至造成疾病肆虐。另一方面,當你和其他人都接種了疫苗,就像比試膽量遊戲中兩輛車都轉向的結果。雖然大家都可能受到疫苗副作用的影響,但是可以防止疾病的大範圍傳播。

在接種疫苗的博弈中,也存在兩個納什均衡,一個是「你接種疫苗,其他人都不接種疫苗」,另一個是「你不接種疫苗,其他人都接種疫苗」。分析一下你可能會認為,自己受益最大的策略組合應該是「自己不接種疫苗,其他人都接種疫苗」。這樣一來,除自己之外的人都接種了疫苗,可以防止疾病的大爆發,自己感染這種疾病的風險也大大降低了。而與此同時,自己沒有接種疫苗,就不會受到疫苗副作用的影響。風險讓別人承擔了,而自己又可以享受到好的結果,看起來真是一個不錯的選擇。

預防接種不達到一定的比例,就無法起到預防疾病爆發的作用。如果大家都像你剛才那樣想,自己不去接種,等別人去接種,那麼結果接種的比例一定很低,從而失去控制疾病爆發的作用。所以,我們不能只從個人的角度出發考慮問題。也正因為如此,國家一般把接種疫苗作為一個公民的義務固定下來,這也是保護公民的一種手段。

第三章 總結

●在非合作博弈中,也可以通過與對手進行協調,來增加自己的收益。

●為了讓博弈向有利於自己的方向發展,不僅要研究策略,還可以從改變收益的角度入手。

●要想贏得鬥雞博弈,讓對方看到自己「無路可退」,是個很有效的策略。

●讓對方感覺我們是「瘋子」,也有一定的震懾作用。