讀古今文學網 > 石頭剪刀布博弈心理學 > Chapter 5 第五章 動態博弈 >

Chapter 5 第五章 動態博弈

所謂動態博弈,就是局中人按順序先後採取行動的博弈。本章將為大家介紹動態博弈的基礎知識、具有代表性的博弈模型以及策略的操縱。我們將一起學習博弈的展開型表述形式——「樹形」,以及從收益反向追溯策略的逆向歸納法,從而推動博弈向有利的方向發展。

20數字遊戲的必勝之法

~動態博弈/逆向歸納法~

◎例題5-1 20數字遊戲

現在給大家介紹一個數字遊戲。兩個人做遊戲,一個人先從1~20的數字中選一個數字說出來,然後另一個人接著他的數字往下數,輪流數下去,誰先數到20誰就獲勝。每個人一次可以說一個數字,也可以說兩個連續的數字。比如,可以說「1」,也可以說「1、2」。在這個遊戲中,先說的人有必勝之法。你知道是什麼方法嗎?

這個例題是一個簡單的動態博弈。局中人可以瞭解對方的策略,然後根據對方的策略來制定自己的策略。這個遊戲的必勝之法,可以通過從後往前數,分析出來。

遊戲規則規定,誰先數到「20」誰就贏。那麼,獲勝的方法有兩個,一個是數到「20」,另一個是數到「19、20」。因此,只要想辦法讓對方從18開始數起,我們就贏定了。因為那樣的話,對方就只能數「18」或者「18、19」,接下來我們就可以數「19、20」或者「20」。也就是說,先說的人,只要讓自己數到「17」就行了。按照同樣的道理繼續往前追溯,我們會發現,只要先說的人數到「14」「11」「8」「5」「2」就可以贏。也就是說,先說的人應該先數「1、2」,這樣就可以必勝了。真的是這樣嗎?趕快找個身邊的親戚、朋友、同學、同事試一下吧。

在動態博弈中,我們可以根據雙方最後的收益,反向分析策略的運用。這種方法叫作逆向歸納法。這是研究動態博弈的一個非常重要的方法,所以請你一定要牢記。

博弈樹形的繪製方法

~用博弈樹形來表述動態~

在前面的章節中,我們主要講解的是靜態博弈,而且大多是用策略型的收益表來表述靜態博弈。在這一章中,我們主要講解動態博弈,這次我們用展開型來表述。展開型就是用樹狀圖形來表示,所以也通稱為「博弈樹形」。

繪製博弈樹形,首先要確定一個初始點,博弈就是從這一點開始的。如果用一棵樹進行比喻的話,這個初始點就相當於「樹根」。從初始點開始,延伸出線條,表示先採取策略的局中人A的策略選擇。這些線條相當於「樹枝」。在局中人A的「樹枝」上,局中人B會做出策略選擇,像初始點一樣,會從「樹枝」的某一點上延伸出B的線條。這一點就叫作「策略決定點」或「節點」。為了與初始點進行區別,節點用實心圓表示,初始點用空心圓表示。在樹枝的最末端,可以總結出局中人最終的收益。博弈樹形一般可以從下往上展開,也可以從左往右展開。

繪製博弈樹形的基本規則是:

·所有「樹枝」、節點,都必須與「樹根」有聯繫;

·「樹枝」之間不能發生交叉。

有的時候,對於沒有被採納的「樹枝」,要用雙橫線勾掉。這被形象地稱為「剪枝」。

讓老闆給自己加薪的方法

~加薪談判博弈/策略的操縱——「威脅」1~

在動態博弈中,因為是按順序先後實施策略,所以局中人可以瞭解對方的策略,並且在分析對方策略的基礎上做出自己的選擇。也就是說,自己的策略可以對對方施加影響,反過來,自己也會受到對方策略的影響。我們可以使用一系列策略影響對方制定策略的思路,從而使博弈向著有利於自己的方向發展。這就叫作「策略操縱」,具有代表性的就是「威脅」和「明確表態」。威脅是策略操縱中經常使用的手段,比如強迫別人做某件事的時候,可以說:「你不做的話,我就……」阻止別人做某件事的時候,就說:「你不要那麼做!否則我就……」我們通過下面的例題來分析一下威脅策略會給對方帶來什麼樣的影響。

◎例題5-2加薪談判博弈

你在一家公司已經工作了有些年頭,也對公司做出了很多有益的貢獻。但是,你覺得公司給的薪水太低了,和你的付出不成正比。於是,你直接去找總經理商討加薪的事情。可是你心裡清楚,以前跟總經理提出「加薪10%」的時候,基本上都被駁回了。這次你該把談判的重點放在哪裡呢?或者說,你有什麼籌碼呢?

我們首先站在總經理的角度來考慮一下這個問題。對於總經理來說,利潤是公司的頭等大事。如果增加員工的薪水,就會增加成本,降低利潤,所以他會盡量抑制薪水的上漲。但是,公司的利潤又是員工辛勤工作創造出來的,如果不給員工加薪,他們就不願意努力工作,甚至有辭職走人的可能。尤其是像你這樣的優秀員工,如果讓總經理意識到不加薪你就可能辭職的話,這場談判就會朝著對你有利的方向發展。

~加薪談判博弈/策略的操縱——「威脅」2~

這場博弈是從你「要求加薪」開始的。當總經理接到員工的加薪請求時,他可以採取的策略我們姑且設定為兩個:「加薪」和「不加薪」。我們把初始點放在總經理身上,從他身上延伸出兩條線,一條是「加薪」,一條是「不加薪」。

如果總經理同意加薪,那麼你得到10%的加薪,這個博弈就結束了。如果總經理不同意加薪,你也準備了兩個策略——「辭職」和「不辭職」。如果你辭職的話,公司和總經理就會失去你這樣一個優秀的員工,之後為公司創造利潤的人就會少一個。如果你不辭職的話,一切就都沒有改變,你拿著原來的薪水幹著不變的工作。

我們先來繪製一張博弈樹形圖。從上面往下看我們可以發現,當總經理選擇「不加薪」的策略時,你必須讓他清楚,你會選擇「辭職」的策略。換句話說,就是你威脅總經理說:「不給我加薪的話,我真的要辭職了!」一定要讓對方覺得你是動真格的了。如果總經理感覺「那傢伙不過是說說罷了,我不給他漲工資,他也不會辭職的」,那你就失敗了。

為了提高你的威脅的可信度,你有必要散佈一些附加信息。比如,你在同事中宣揚,說你已經找到一家公司願意出更高的薪水來僱用你。而且,不要悄悄地和總經理談判,要事先在同事面前廣泛地散佈這個消息,對他們說:「要是總經理不給我加薪,我就走人!」這樣一來,如果加薪談判失敗,你還留在公司裡就會成為眾人的笑柄,到時候恐怕很難繼續在公司工作了。讓總經理感受到你已經把自己推到懸崖邊上,他就會認真考慮你的加薪要求了。

遇到強盜,應該屈服嗎?

~強盜的策略/「威脅」的可信度1~

一天晚上,參加聚會之後,時間已經很晚,你一個人獨自走在回家的路上。當你走出繁華的商業街,在往地鐵站走去的小路上,突然背後傳來一個聲音:「把錢交出來!否則我就開槍!」與此同時,你感覺到一個堅硬的物體頂在自己的後背上。我們來分析一下這個博弈。局中人有兩個,你和強盜,當前的狀態可以用動態博弈來表示。

強盜用一個疑似槍的物體頂住了你的後背,這是一個初始點。此時可供你選擇的策略有兩個:「交出錢包」或「不交」。這個強盜到底是誰,你不知道,他手裡拿的那個東西是不是真槍,裡面有沒有子彈,你也不清楚。

如果你乖乖交出錢包,可以保住性命,但錢包裡的現金、銀行卡就會被搶走。我們將這種情況的收益設定為-5。站在強盜的角度看,搶來的錢包中除了現金之外,其他東西都沒什麼用處,所以他的收益是4。如果你選擇拒絕交出錢包,那麼強盜可以選擇的策略有「開槍」或「逃走」。如果強盜開槍的話,你可能受重傷甚至死亡,所以你的收益是-10。強盜打傷或打死你,搶到錢包,這時他的收益是3。如果強盜選擇逃跑的話,你的生命安全和錢財都不會有損失,只是會留下一段恐怖的記憶,你的收益是-1。強盜逃跑的話,他獲得的只有被警察逮捕的風險,所以他的收益是-1。

當你選擇「不交出錢包」的時候,強盜「逃走」的話,你的收益最高。可是,強盜的收益又會怎樣呢?如果你「不交出錢包」的話,與「逃走」相比,強盜有一個更高收益的選擇,那就是「開槍」。由此可見,強盜發出威脅「把錢交出來!否則我就開槍!」的可信度還是很高的。

~強盜的策略/「威脅」的可信度2~

假設你遇到了和前一小節一樣的情況,被強盜劫持了,可是這次強盜手裡拿的不是疑似槍的物體,而是一個雷管,強盜對你說:「把錢交出來!否則炸死你!」

此時如果你選擇「交出錢包」,那就和前面一樣,這場博弈到此結束。如果你選擇「不交出錢包」,而強盜選擇「逃走」的話,那你們雙方的收益也和前一小節博弈中的一樣。但是,當你選擇「不交出錢包」,而強盜選擇「引爆雷管」時,情況就大不一樣了。你可能在爆炸中受重傷,最嚴重的情況也可能喪命。這種情況下你的收益是-10,而強盜肯定也會被炸傷甚至死亡,因此他的收益和你一樣,也是-10。強盜的武器由槍變成雷管後,他也要承擔被武器損傷的後果。

也就是說,如果強盜使用的武器是槍的話,那麼當你選擇「不交出錢包」時,強盜的最優反應是「開槍」。但如果強盜的武器換成了雷管,那麼當你選擇「不交出錢包」時,強盜的最優反應應該是「逃走」。換句話說,「把錢交出來!否則炸死你!」這種威脅的可信度很低。在生意的世界中,我們就常遇到這種「嚇唬人的威脅」。如果僅憑感覺進行判斷的話,往往容易被對方嚇住,但如果用博弈論的理論作為武器,就能很容易地分辨出威脅的真偽。

這個博弈也可以從最後的收益往前追溯分析,用逆向歸納法找到正確的策略。

沒有退路可走,也是一種力量

~背水一戰/策略操縱——「明確表態」~

除了「威脅」之外,「明確表態」也是一種操縱策略的方法。「明確表態」,顧名思義就是明確地表達自己的態度、立場,以影響對方的決策。其實,在序章中「放棄一些選項」和第86~91頁的「鬥雞博弈」中,都涉及「明確表態」的策略。

我們這次用展開型來表述序章第6頁中的博弈。你的國家和敵國都有「進攻」或「撤退」的策略可選。如果你選擇「進攻」而敵國也選擇「進攻」的話,因為你的國家實力弱於敵國,所以兩國交戰之後貴國的收益是-100,敵國的收益是-50。如果你選擇「進攻」而敵國選擇「撤退」的話,那麼貴國的收益是10,敵國的收益是-20。如果你選擇「撤退」而敵國選擇「進攻」的話,那麼貴國的收益是-50,敵國的收益是100。如果兩國都選擇「撤退」,那麼雙方的收益都是0。我們先來繪製一張收益表,從收益表中我們可以看出,這個博弈存在兩個納什均衡:貴國「進攻」、敵國「撤退」和貴國「撤退」、敵國「進攻」。但是,我們並不知道該選擇哪一個納什均衡。

於是,我們把這個博弈看作動態博弈,然後用博弈樹形來加以分析。結果發現,為了將這場博弈引向對自己有利的納什均衡,貴國首先不能選擇「撤退」。所以,你應該向敵國表明自己將要「進攻」的態度。而且,為了讓敵國和本國軍民相信你只有「進攻」這一種策略可以選擇,或者說讓他們看到你選擇「進攻」的決心,將城裡儲存的食物扔掉,這就是一種有效的「明確表態」的方法。這樣的行動可以對敵國起到震懾作用,也可以增強本國軍民戰鬥到底的決心,並最終讓博弈朝著有利於自己的方向發展。

成功開拓新市場的企業和失敗的企業

~開拓新市場的博弈/開拓老年人旅遊的新市場1~

在商業領域,有些行業已經非常成熟,很多企業在這些行業中已經打拼多年,能夠穩定地贏利,甚至有些巨型企業呈現出壟斷其所處行業的傾向。但是,也有一些企業想中途涉足,希望在這個行業中找到自己的立足之地。但是,對於新加入的企業來說,想在成熟的市場中站穩腳跟並不是那麼容易的,因為會遇到各種各樣的障礙和困難。

美國著名的經營管理學家邁克爾·波特在其著作《競爭戰略》中列出了八項具體的條目來衡量開拓新市場時遇到的障礙的大小。這八條分別是:「確保流通渠道的難易度」「產品差別化的存在」「巨額投資的必要性」「更換供貨商所產生的成本的大小」「規模經濟是否起作用」「在規模經濟之外的成本方面存在的不利性」「政府政策對企業加入新市場的限制」「該行業中現有企業進行報復的可能性」。

接下來我們就把企業進軍新市場時的狀況用博弈樹形來進行分析,用博弈論的理論來分別思考一下該行業中現有壟斷企業可能做出的防禦對策,以及新進企業的策略要點。假設有一家高級猴子旅遊公司(S公司)想要進軍老年人的旅遊市場,而老年人的旅遊市場幾乎被大猩猩觀光公司(G公司)獨佔著。在這種情況下,如果S公司不進入這個市場,那麼S公司的收益是0,與此同時,G公司將維持他們在該市場中的利潤,所以收益是40。如果S公司加入進來的話,G公司有兩種策略可以選擇,一是「融合」,二是「反抗」。如果G公司選擇「融合」,那麼這個市場原有的價格可以維持,結果S公司的收益是10,G公司的收益是20。如果G公司選擇「反抗」的話,他們會壓低價格以吸引顧客。這時,S公司可以選擇停止加入該市場,即「退出」,也可以選擇參與價格競爭,即「對抗」。S公司選擇「退出」的話,G公司的收益是30,S公司的收益是-10,因為之前付出的成本已經不能收回了。如果S公司選擇「對抗」的話,那麼兩家公司將陷入價格競爭的消耗戰,我們推測G公司的收益是10,而S公司的收益將是-20。

當設定好所有收益之後,我們就採用逆向歸納法從後往前分析。先看最終的最高收益,S公司的最高收益出現在S公司加入,而G公司選擇「融合」策略的時候。但是,S公司不知道G公司到底會選擇「融合」還是「反抗」。如果G公司選擇「反抗」的話,那麼對於S公司來說,與「對抗」相比,選擇「退出」的收益似乎更高一些。G公司通過合理的思考,他們不會選擇收益較小的「融合」,而應該選擇「反抗」。這樣看來,S公司還是從一開始就不要進軍這個市場比較好。

~開拓新市場的博弈/開拓老年人旅遊的新市場2~

如果G公司沒把S公司放在眼裡,知道很快就可以把它們趕出這個市場的話,也許G公司採取的「反抗」策略就不會太激烈。只要利用自己現有的渠道和客戶群,推出一款S公司無法對抗的新的旅遊產品,就可以在不打價格戰、不損害自己利益的情況下,將S公司驅逐出去。而對此,S公司可以用「明確表態」的策略給G公司施加壓力。比如S公司前期投入大量資金,讓G公司看到「我們已經沒有退路,必須戰鬥到底」。當這種威脅的可信度非常高的時候,G公司為了避免在競爭中蒙受巨大的損失,就可能降低「反抗」的姿態。而S公司因為前期投資非常大,如果「退出」的話,損失將會異常慘重。於是,這個時候博弈樹形就發生了變化(表5-4)。當G公司「反抗」的時候,對於S公司來說,選擇「對抗」比「退出」的收益要高一些。

另外,S公司還可以選擇不和G公司發生直接碰撞的間隙市場作為出發點。間隙市場規模比較小,即使獲得成功,收益也不會太大,但初期投資也花費不了多少(圖5-5)。在這種狀況下,市場中現有的企業——彎彎旅行社(W社)即使以降低價格的策略進行「反抗」,S公司受到的損害也不大。結果,S公司成功實現了進軍新市場的目標。

從間隙市場入手,取得成功的典型案例就是美國的西南航空公司。他們把目光聚焦在國內城市之間的短距離航線,以低廉的價格提供航空服務。他們的飛機就像「在天空中飛行的公共汽車」。「低廉的機票價格」「頻繁地飛行」是他們的基本方針。在開航當時,從洛杉磯到菲尼克斯(鳳凰城)每天甚至能飛40個班次。

另外,原本飛機上都是指定席位,但他們將其改革成自由席位,從而極大限度地簡化了登機手續。美國西南航空公司通過進行徹底的人性化、合理化的改革,壓縮了初期成本和運行成本,在大型航空公司不願涉足的間隙市場取得了巨大的成功。

軟銀集團涉足移動通信領域的策略

~開拓新市場的博弈/進軍移動通信市場1~

現實中,每天都有新企業誕生,也有老企業進軍新市場。其中,日本的軟銀集團(SoftBank,以下簡稱SB集團)在2006年進軍移動通訊領域的時候,就打了一場漂亮的戰役。他們製作的名為「白戶家」的電視廣告非常有趣,極大地提高了觀眾對SB集團的好感。然後,SB集團又在智能手機市場中通過與蘋果公司簽約,牽制了競爭對手DoCoMo(以下簡稱D公司)。總之,SB集團採用了一系列積極進攻的手段。

移動通信市場可不是一個簡單就能涉足的領域,甚至可以說是非常艱難的,因為需要「巨額的資金投入」。現實中就有不少企業貿然進軍移動通信市場,結果發現需要的資金比預想的高出很多,最終導致破產。可是,一旦成功的話,就能獲得巨額的回報。

接下來,我就為大家簡單地介紹一下SB集團成功進入移動通信領域的經過,我們一起來分析一下他們成功的經驗。如果SB集團不進入這個市場,我們假設原本這個市場的壟斷者D公司的收益是100。如果SB集團選擇加入進來,那麼D公司可以選擇「融合」或者「反抗」。如果D公司選擇「融合」,那麼兩家公司可以維持市場中的高價格,雙方分享整個市場。假設兩家公司平分市場的話,那麼兩者的收益都是50,如果將SB集團進軍這個市場的成本設定為15的話,那麼SB集團的最終收益是35。

如果D公司進行「反抗」,降低價格,想以價格競爭拖垮SB集團的話,那麼SB集團可以選擇「退出」或者「對抗」。根據D公司「反抗」的強度,SB集團、D公司的收益可能會出現較大的差異。如果SB集團選擇「退出」,那麼前期投入的成本無法收回,因此最終收益只有-15。而D公司在採取「反抗」措施的時候花去了10的促銷成本,因此D公司的最終收益是100-10=90。如果SB集團採取低價格策略與D公司「對抗」的話,結果又會怎樣呢?假設在價格競爭中,兩家企業的利潤都折半了,那麼雙方的收益就都是25,而且還要減去促銷成本10,結果雙方的收益就都是15。不僅如此,SB集團還要減去前期投入的資金15,最終的收益是0。另一方面,D公司最終的收益是15(圖5-6)。

面對這種情況,SB集團的經營者想,如果要從零開始涉足移動通信市場,首先要投入巨額的資金建設基站,之後在與競爭對手的打拼中還難以取得勝利。於是,SB集團決定初期先借用合作夥伴的通信網為客戶提供通信服務。然而,在和沃達豐公司談判的過程中,「借」通信網變成了「買」通信網。經過艱苦的談判,最終SB集團以1兆7500億日元的價格收購了沃達豐日本分公司。這是除了金融機構的併購之外,日本企業併購市場上企業併購的最高金額。

~開拓新市場的博弈/進軍移動通信市場2~

我們把SB集團採取的策略和實際情況綜合分析一下。

1.降低加入成本

SB集團收購沃達豐日本分公司的金額高達1兆7500億日元,看起來加入的成本相當高。但是,收購了沃達豐日本分公司之後,就不用從零開始建設基站了,而且還直接接收了沃達豐日本分公司已有的1500萬客戶和1800家店舖。總體上來說,這比從無到有地重新建設,節省了不少資金投入。

2.該行業現存企業的應對策略

在SB集團加入移動通信領域之前,該市場中已經有D公司和KDDI公司。當SB集團進入這一領域時,現存的兩家公司採取了「融合」策略。原本SB集團打算進入這個市場之後,首先以降低服務價格的方式來開拓市場,可是真正進入市場之後,發現其他兩家公司迴避了價格競爭。這兩家公司並沒有調整價格,也沒有採取什麼特殊的應對措施。在這種情況下,SB集團提出了一個低價格策略,即SB集團的客戶之間通話和發送短消息是免費的。這一策略具有相當大的衝擊性,確實提高了SB集團的市場份額。結果,SB集團非常成功地加入了移動通信行業。

3.月租策略

看到SB集團通過低價格策略不斷擴大市場,其他兩家公司也急忙開始降價促銷。有的公司推出存話費免費贈送手機活動,有的公司則推出手機以舊換新服務。這時,SB集團推出的優惠政策是預存兩年月租費,就可以享受話費與月租費相抵的活動。對客戶來說,就相當於兩年之內零月租。這樣一來,至少可以將現有顧客保留兩年。

第五章 總結

◎在動態博弈中,採取從結果往回分析的方式尋找最佳解決方案的方法很有效,這種方法叫作逆向歸納法。

◎在和老闆的加薪談判中,事先要放出一些口風,讓老闆相信「不加薪,我就辭職」。

◎在涉足新市場的時候,如果前期投入太高、競爭公司又採取對抗策略的話,就很難成功。