石頭剪刀布博弈心理學：Chapter 1 第一章博弈心理學的基礎知識與支配性策略_木瓜製造

首先為讀者朋友們介紹博弈心理學的基本思維方式、規則和種類等基礎知識。然後解說博弈的局中人如何找到讓自己的收益最大化的策略，以及無論對手採取什麼樣的策略，我們在自己的幾種策略中選擇較好的策略，即「支配性策略」。

博弈論的基本要素

～局中人～

博弈論最基本的要素有三個，分別是：

1.局中人

2.策略

3.收益

◎局中人

在一場博弈中，登場的企業或者個人，就叫作局中人。不同的博弈，局中人的數量也不同，可能是2個、3個甚至更多。既有個人對個人，也有企業對企業的案例。

局中人可謂博弈的前提條件，沒有人參與，就不能算博弈。我們事先設定局中人在參與博弈的時候，是按照下述基本原則採取行動的。

·為自己爭取最大的收益而行動；

·局中人會合理地思考，不會採取讓自己遭受損失的行動；

·不會產生誤解或設想錯誤。

在現實中，人不會在所有時間都採取合理的行動，也並不是所有人在任何時候都追求收益最大化，而且人也常出現誤解或設想錯誤的情況。但是，在博弈論中，我們姑且認為局中人會為了自己的利益最大化而努力，而且不會採取錯誤的行動。局中人預測對手將採取對自己最有好處的策略，並在此基礎上尋找對自己最為有利的策略。也就是說，己方所採取的最佳策略，會根據其他局中人的行動進行調整，而其他局中人的最佳策略，也會根據己方的行動發生改變。

局中人雖然不會產生誤解或設想錯誤，但為了自己的利益，會進行執著的談判，通過協議來約束對方，有時甚至強迫他人。總之，在博弈論的世界裡，局中人會採用各種各樣的手段來維護自己的利益，爭取收益最大化。

～策略、收益～

◎策略

所謂策略，是指在博弈中，局中人為了達到目的為自己的行動所做的計劃。在企業之間的價格競爭中，準備將自己的商品價格設定為「100日元」或「80日元」，這就是策略；在猜拳遊戲中，從「石頭」「剪刀」「布」中選擇一種手勢，也是策略。

在博弈中，會遇到各種各樣的情況，我們有策略，別人也有。大家一定要牢記，自己得到的結果，並不全是由自己的行為帶來的，還會受到其他局中人行為的影響。

◎收益

所謂收益，就是局中人獲得的利益。不同的博弈，其收益也各不相同，比如有的收益是金錢，有的則是商品的銷售數量，還有的是勝負。在企業間的價格競爭中，企業獲得的利潤就是收益；在猜拳遊戲中，贏就是收益。為了便於比較，我們可以把贏設定為「1」，把輸設定為「-1」，把平局設定為「0」。

通過前面的數值設定，我們可以更加直接、客觀地比較後分析出，在博弈中，「局中人」為了獲得最大的「收益」應該選擇什麼樣的「策略」。之後，再據此採取最為適合的行動，最終獲得最大的收益。

博弈的種類

～局中人採取行動的時間順序/靜態博弈和動態博弈～

在博弈中，各個局中人採取行動的時機可能有所不同。既有可能同時採取行動，也可能先後有別。同時採取行動和先後採取行動是兩種不同的博弈。因此，博弈論中按照局中人採取行動的時間順序，可以將博弈分為靜態博弈和動態博弈。

◎靜態博弈

靜態博弈，就是各個局中人同時採取行動的博弈。另外，雖然採取行動的時機有先後，但後者並不知情的博弈，也屬於靜態博弈。舉例來說，每月同一天出版上市的雜誌之間的博弈就是靜態博弈；不同飯店在同一時期推出新菜單的博弈，也屬於靜態博弈。更簡單的例子就是「猜拳遊戲」，參與猜拳的人必須同時出手勢，誰後出，或者後來改變手勢，都算犯規，而且會遭到大家的鄙視。在博弈中，選擇策略的時機非常重要。在靜態博弈中，我們必須和對手同時決定策略，事前不可能知道對手的策略。博弈論中的經典案例「鬥雞博弈」和「囚徒困境」都屬於靜態博弈。

◎動態博弈

局中人的行動有先後順序的博弈，就是動態博弈。舉例來說，拍賣就屬於動態博弈。一位買家出價後，其他買家可以據此調整自己的策略，隨即出價。家用電器銷售企業的價格競爭也是動態競爭。一家銷售商可以對其他對手的定價策略進行調查，然後確定一個更低的售價，並打出「本地區最低價格」的廣告。

我們日常生活中動態博弈的例子也不少，比如打撲克、下象棋、打麻將等棋牌類的遊戲。玩棋牌遊戲時，大家都是按順序先後出牌，後者可以根據前者所出的牌確定自己的策略。按順序先後行動並不是動態博弈的要點，能夠根據對手的行動改變自己的策略，才是動態博弈的關鍵。

～局中人之間的合作關係/非合作博弈與合作博弈～

根據局中人是否存在合作關係，博弈還分為非合作博弈和合作博弈。如果局中人之間有一個具有約束力的協議，那就是合作博弈；如果沒有，就是非合作博弈。經濟學家所研究的博弈以非合作博弈為主，本書中也主要講解非合作博弈。

◎非合作博弈

非合作博弈，是指局中人之間沒有合作關係（具有約束力的協議）的博弈。各個局中人不會協助對手，只追求自己的最大收益。在現實生活中的營銷戰略、收視率競爭等經濟活動中，常會用到非合作博弈的思維方式。再有，根據對手的策略選擇己方策略的象棋、麻將等棋牌遊戲，也屬於非合作博弈。

此外，博弈中還有一種「協調博弈」。協調博弈在我們日常生活中的典型例子就是乘坐自動扶梯時，大家靠左站還是靠右站的問題。在日本的關東地區，人們習慣站在左側，把右側空出來；而在關西地區，人們則喜歡靠右側站，把左側空出來。不過，靠哪邊站並沒有明文規定，也不是大家商量之後的結果，而是約定俗成。人們在乘坐自動扶梯的時候，看大多數人站在哪邊，就跟著站在哪邊。不遵守這個規則，也不會受到懲罰。雖然不具有約束力，但人們大多會自覺遵守這個規則，因為給別人方便也會給自己帶來方便。雖然情況有點兒複雜，但協調博弈可以算作非合作博弈中的一種。

◎合作博弈

所謂合作博弈，是指參加博弈的局中人相互之間可以進行協商、協助。局中人通過交涉達成的協議、規則是具有約束力的，並且各個局中人會按照協議、規則來選擇策略。多個局中人對利益進行分配的博弈，屬於合作博弈。與非合作博弈相比，合作博弈更加複雜，而且常帶有政治色彩。近些年來對合作博弈的研究進展迅速，應用也越來越廣泛和深入。

具有代表性的博弈例子

◎非合作博弈

（博弈的局中人之間不存在合作關係）

·鬥雞博弈

·囚徒困境

·男女博弈

·協調博弈等

◎合作博弈

（博弈的局中人受協議、規則的約束）

·打車費均攤的協議

·演員分配角色等

～局中人對信息的掌握情況和損益的總和～

除了前面幾種分類標準外，還可以根據局中人對信息的掌握情況以及利益的總和對博弈進行分類。

根據局中人對信息的掌握情況進行分類

◎完全信息博弈

局中人對其他局中人的策略都有充分瞭解的博弈叫作完全信息博弈。比如象棋、圍棋等棋類遊戲，對手所採取的「招式」和策略，一目瞭然，自己的一舉一動，對手也瞭如指掌。這樣的博弈就是完全信息博弈。

◎不完全信息博弈

在博弈中，不瞭解其他局中人所採取的行動和策略，這便是不完全信息博弈。有些博弈，雖然局中人瞭解對手所擁有的選項，但並不知道他最終會選擇哪一個，這樣的博弈也可以稱為不完全信息博弈。因為有尚未知曉的信息，因此才叫不完全信息博弈。此外，靜態博弈也屬於不完全信息博弈，因為所有局中人同時採取行動，在行動真正實施之前，任何人都不知道對手將採取什麼樣的行動。

根據博弈中局中人對信息的掌握情況，博弈還可以分為「信息完備博弈」和「信息非完備博弈」，以及「信息對稱博弈」和「信息非對稱博弈」。所謂「信息完備博弈」就是指局中人共享規則和所有信息的博弈。

根據利益的總和進行分類

◎定和博弈

各個局中人利益的總和是一個固定數值的博弈，叫作定和博弈。舉例來說，A公司的市場份額為65%，B公司的市場份額為35%。兩家公司的市場份額相加就是整個市場份額，這是一個固定的值，因此A公司與B公司的博弈就屬於定和博弈。

在定和博弈中，各個局中人的利益和損失相加後為零的話，叫作零和博弈。兩人猜拳、下象棋、下圍棋、踢足球、打棒球等雙方進行對決的比賽，都屬於零和博弈（得分和失分相加等於零）。

◎非定和博弈

局中人的利益總和不是一個固定數值的博弈，就叫作非定和博弈。企業之間的銷售額競爭、拍賣、保險金額與投保人數的關係等，都屬於非定和博弈。

◎戰爭就是具有代表性的零和博弈。

博弈的表述形式

～策略型與展開型～

關於博弈論的基礎知識，大家首先應該瞭解博弈的重要表述形式有兩種。一場博弈，可以根據信息量的多少、進行比對的內容等，選擇合適的表述形式。

◎策略型

所謂策略型表述形式，是將博弈的局中人、策略、利益等用表格的形式表現出來，這種表述形式也叫作「標準型」。這種表格可以將各個局中人的收益清晰地展現出來，因此也叫作「收益表」。博弈的目的是獲得最大的利益，而不是戰勝競爭對手。策略型的表述形式能夠將博弈的目的——獲得最大利益與局中人所採取的各種策略之間的關係，清楚地表現出來。

靜態博弈不需要加以展開，因此沒必要採用展開型來表述，一般都用策略型。關於策略型表述形式的歸納方法和使用方法，將在第一章稍後的內容及第二章中進行詳細解說。

◎展開型

博弈的展開型表述形式，也叫樹形表述形式。顧名思義，就是使用點和線描繪出樹枝狀圖表的形式。一般都是從下向上展開或者從左向右展開。尤其是從下向上展開，很像樹枝的形狀。當一方局中人根據其他局中人的策略改變自己的策略，以及策略展開非常複雜或者信息量很大的時候，適合採用展開型來表述。有關展開型表述形式的具體內容，將在第五章中進行講解。

◎策略型

◎展開型

牛肉蓋澆飯屋之類的快餐店，為什麼要降價？

～快餐店的營銷策略/強支配性策略１～

接下來，我們就對博弈論進行具體的講解。牛肉蓋澆飯屋、炸雞連鎖店等快餐店之間，存在著非常激烈的競爭關係，有時不僅要比拚菜品的味道，還要在價格上做文章。很多快餐店看到競爭對手降價，也跟著降價。這到底是為什麼呢？我們通過兩家快餐店的靜態博弈，來一探價格競爭策略的究竟。

◎例題1-1快餐店的價格設定

假設在某條商業街有兩家快餐店A和B。這兩家快餐店無論菜品味道還是服務質量，都旗鼓相當，顧客對它們的評價也不相上下，因此它們之間的競爭異常激烈。A店和B店每份快餐的平均價格都為500日元，雙方都很關注對方的價格，而且都有降價爭取更多顧客的想法。他們各自在糾結，是否要將價格降為450日元。

假設食材成本、人工費、水電費等成本平攤到每一份快餐的費用為250日元，而且兩家店的成本一樣，那麼每份快餐的價格不可能降到250日元以下。再假設長期光顧這兩家快餐店的顧客一共有400人，因為他們對兩家店的評價幾乎一致，所以價格一樣的話，會有一半的客人去A店，另一半去B店。如果存在價格差異，那麼將有八成客人去較為便宜的那家店。如果你是A店的經營者，為了獲得最大的利潤，你會採取怎樣的定價策略呢？

A店如果通過降價的方式與B店競爭，那麼B店不跟著降價的話，A店肯定會贏。但是，儘管贏了，A店的利潤也會下降，所以從這個角度講，A店想保持原價，不降價。捲入價格競爭的漩渦，對雙方來說都將是一場慘烈的消耗戰，對誰都沒有好處。身處這種境地，A店是該降價，還是繼續維持原有價格呢？

下面我們用策略型表述形式的「收益表」對這道例題進行分析。

～快餐店的營銷策略/強支配性策略１～

下面我們來計算一下收益表中的「收益」。我們計算A店收益的時候，就得從A店的角度出發思考問題。表中的「收益1」，是指A店以500日元銷售快餐，B店也以500日元銷售的時候，A店獲得的利潤。

在這道例題中，我們假設一份快餐的平均利潤是用銷售價格500日元減去平均成本250日元，結果等於250日元。如果兩家店都以500日元的價格進行銷售，那麼400名顧客中有200人購買A店的快餐。

這麼一來，250日元×200人=50，000日元。這也就是A店的「收益1」。

A店的「收益2」是A店以450日元的價格銷售快餐，而B店以500日元銷售的時候，A店獲得的利潤。450日元的售價減去250日元的成本，一份快餐的平均利潤為200日元。因為此時A店的售價比B店低，可以獲得八成的客人，400人的八成是320人。那麼最終計算得到的「收益2」是200日元×320人=64，000日元。

A店的「收益3」是A店以500日元的價格銷售快餐，而B店以450日元銷售的時候，A店獲得的利潤。500日元的售價減去250日元的成本，一份快餐的平均利潤為250日元。但是，因為A店的售價比B店高，所以只能獲得兩成的客人，400人的兩成是80人。於是，最終計算得到的「收益3」是250日元×80人=20，000日元。

A店的「收益4」是A店以450日元的價格銷售快餐，而B店也以450日元銷售的時候，A店獲得的利潤。450日元的售價減去250日元的成本，一份快餐的平均利潤為200日元。因為A店與B店的售價相同，所以可以獲得400名顧客中的一半，也就是200人。於是，最終計算得到的「收益4」是200日元×200人=40，000日元。

～快餐店的營銷策略/強支配性策略１～

現在我們開始從收益表中尋找最佳策略。所謂最佳策略，就是能讓局中人獲得最大收益的銷售價格。

先看B店以500日元銷售快餐時的情況，此時，如果A店也以500日元銷售，那麼A店將獲得5萬日元的利潤。如果A店以450日元銷售，那麼利潤將達到6.4萬日元。由此可見，如果B店的快餐賣500日元一份的話，A店將售價降至450日元，將獲得更多的利潤。為了更清楚地顯示這一點，我們將兩者中比較低的利潤用紅筆勾掉（表1-2）。

再看B店以450日元銷售快餐時的情況，在這種情況下，如果A店以500日元銷售，那麼A店只能獲得2萬日元的利潤。如果A店以450日元銷售，那麼獲得的利潤將是4萬日元。由此可見，如果B店的快餐賣450日元一份的話，那麼A店也賣450日元對A店更有利。我們再將收益低的一方（2萬日元）用紅筆勾掉（表1-3）。

從表1-4中我們可以看出，不管B店採取哪種價格策略，A店以450日元的價格銷售都更為有利。

在博弈中，存在不管對手採取什麼樣的策略，總對自己有利或不利的策略。像這樣，對其他策略都形成支配的策略，叫作支配性策略。其中，不管對手採取什麼樣的策略，己方的某一策略都可以獲得比其他策略更大的收益時，這個策略就叫作「強支配性策略」。在前面的例題中，A店以450日元的價格銷售快餐，就是強支配性策略。

～快餐店的營銷策略/強支配性策略１～

我們來分析一下表1-4。看了這個表之後，估計有些朋友會想，A店採取「450日元策略」，B店也採取「450日元策略」的時候，A店的收益是4萬元；而當A店採取「500日元策略」，B店也採取「500日元策略」的時候，A店的收益是5萬日元。比較下來，A店是不是應該採取「500日元策略」呢？

但是，當B店採取「500日元策略」的時候，對於A店來說最佳定價策略不是500日元，而是450日元，因為這樣可以讓利潤提高1.4萬日元。而且，B店的經營者也不是傻子，會合理地思考，希望追求收益最大化，沒準他們也會降價呢。如果B店真的把價格降為450日元，那麼A店繼續採取「500日元策略」的話，利潤就只有2萬日元了，比當初的4萬日元還要低。

在一場博弈中，支配性策略可以讓局中人獲得最高的收益。可以說，支配性策略就是博弈的「解」。不管對手採取什麼樣的策略，我們都找不出比支配性策略能讓自己收益更高的策略了。所以，我們在為一場博弈求「解」的時候，首先應該確認一下是否存在支配性策略。

消費者根據價格選擇商品或服務的傾向性越強，降價銷售的策略就越容易帶來更多的利潤。分析了前面例題中的博弈模型，我們就能理解快餐業經常傳出降價消息的原因了。

之前，我們分析的是A店的收益表，同樣，B店也有一張收益表。在博弈論中，一般是將兩個局中人的收益情況列在同一張表中的。如果你覺得這樣不好理解的話，也可以分別從每個局中人的角度進行單獨分析。

在評價成績的博弈中，如何獲得較高的評價？

～強支配性策略２～

我們再來看一道有關強支配性策略的例題。這是某一所大學的成績評價方法，請你把自己當作一名大學生，來解決這個博弈問題。

◎例題1-2評價成績博弈

在某一所大學裡，一位教授做了一個有點兒奇怪的實驗。他給教室裡的每位同學發了一張答題紙，讓他們在紙上寫好自己的名字，然後從「α」和「β」兩個希臘字母中任選一個寫在紙上。把學生們手裡的答題紙收上來之後，教授隨機將答題紙兩兩進行分組，然後對學生寫的字母進行評分。

如果你寫的是「α」，而與你同組的另一張答題紙上也寫的是「α」，那麼你的成績為C。如果另一張答題紙上寫的是「β」，那麼你的成績就是A。如果你寫的是「β」，而與你同組的另一張答題紙上寫的是「α」，那麼你的成績為D。如果另一張答題紙上寫的是「β」，那麼你的成績就是B。成績按照由高到低的順序排列依次是A、B、C、D。那麼，為了讓自己獲得最好的成績，到底是該寫「α」還是「β」呢？

局中人

在這個博弈中，局中人是「自己」。此外，因為尚不知道做比較的另外一個人是誰，所以將其稱為「對方」。

策略

策略就是選擇寫「α」還是「β」。

收益

評價結果是A、B、C、D中的一個。A是最高成績，D是最低成績。

～強支配性策略２～

我們就從收益表中尋找最佳的策略。在這裡，最佳策略就是讓局中人獲得更好成績的策略。

當對方寫「α」時，如果自己寫「α」，那自己的成績就是C；如果自己寫「β」的話，成績就是D。兩者進行比較，自己寫「α」的話，可以獲得較高的成績，因此將收益較低的策略從表中勾掉（表1-11）。

當對方寫「β」時，如果自己寫「α」，那自己的成績就是A；如果自己寫「β」的話，成績就是B。兩者進行比較，自己寫「α」的話，可以獲得較高的成績，因此將收益較低的策略從表中勾掉（表1-12）。

這樣看來，不管對方寫「α」還是「β」，自己寫「α」的時候，都可以獲得相對較高的評價（表1-13）。

在這個例子中，不管對方採取什麼樣的策略，都有一個策略能讓自己獲得相對更好的收益。在這種情況下，「寫α的策略」就強支配著「寫β的策略」。其中的關鍵點在於「不管對方選擇什麼樣的策略，都能獲得相對較高的收益」。在一場博弈中，如果存在支配性策略，那麼選擇支配性策略才是正確的，因為這樣才能讓我們獲得最好的收益。

～強支配性策略２～

對於自己來說，「選擇α」這個策略強支配著「選擇β」的策略，因此，在這個評價成績的博弈中，自己應該選擇「α」。也許有的朋友還是無法理解，我再做進一步的解說。

確實，從自己的角度來說，選擇「α」是最明智的。但是，如果大家都這樣想的話，自己寫了「α」，對方寫「α」的可能性也很大，結果，自己的成績為C。可是如果雙方都寫「β」的話，自己的成績為B。肯定有人會疑惑，不是說「α」是最佳策略嗎？可是為什麼寫「β」有可能獲得更好的成績呢？

其實，我們只要稍稍思考一下，就知道那種情況是不現實的。因為在這個博弈中，任何人都不能合謀。本來，自己的答題紙和誰的答題紙分在一組，這是事先無法確定的。因此，對方寫的是什麼，根本無從判斷。即使你有超能力，知道其他人都選擇「β」，那麼經過思考之後，你還是選擇「α」才能獲得更好的成績。因為如果和你分在一組的人選擇的是「β」，那你選擇「α」就可以獲得A。

存在強支配性策略的博弈的要點總結如下：

·在破解一場博弈的時候，先分析收益表，看看是否存在支配性策略；

·如果存在支配性策略的話，選擇支配性策略是最明智的；

·要明白，即使選擇了支配性策略，也不一定能獲得最高的收益。

相信神好處多，還是不信神收益大？

～帕斯卡的賭注/弱支配性策略１～

我們再來看一道和前面不太一樣的支配性策略的例題。「人是一株會思考的蘆葦」是法國著名數學家、物理學家、哲學家帕斯卡流傳後世的一句名言。他還提出過一個令人深思的問題，被稱為「帕斯卡的賭注」。

◎例題1-3帕斯卡的賭注

帕斯卡曾說過，信神比不信神的好處要多。因為信神「將獲得幸福與永生」，而不信神「將失去真和善」。事實正如帕斯卡所說，信神好處多，不信神將遭受損失嗎？其實，帕斯卡用博弈論的思想幫我們分析了這個問題。

局中人

在這個博弈中，一個局中人是「人」，另一個是「現實」。「現實」所反映的是「存在神」，或「不存在神」。

策略

「人」所採用的策略有「信神」和「不信神」兩種；而「現實」可以選擇的策略有「存在神」和「不存在神」。

收益

為了便於理解，我們用數值化來顯示收益。如果真能「獲得幸福與永生」，那麼這無疑是最大的收益，我們將其數值設定為100。另一方面，「失去真和善」自然是最差的收益，我們將其數值設定為-50。

～帕斯卡的賭注/弱支配性策略２～

首先，我們來確認一下這個博弈中是否存在支配性策略。如果現實中「存在神」，那麼人選擇「信神」的策略，收益比較大。於是，我們將採取「不信神」策略時得到的-50勾掉（表1-18）。接下來，再看現實中「不存在神」的情況，此時不管人信不信神，所得到的收益是相同的，都是0，所以沒法勾掉任何數值（表1-19）。

從表中我們可以看出，在現實中「存在神」的情況下，人選擇「信神」，收益比較大。但是，當現實中「不存在神」的時候，不管人選擇信神還是不信神，得到的收益都是一樣的。由此可見，其中的一種策略具有支配性，但另一種策略帶給人的收益是相同的（表1-20）。這種情況下，我們認為，人的「信神」策略對「不信神」策略起到弱支配作用。

強支配性策略，是指不管對方選擇什麼樣的策略，自己選擇任一種策略時都會佔據有利位置。而弱支配性策略，是指不管對方選擇什麼樣的策略，自己選擇某一策略會讓自己有利，或者與對方收益相同。

前面講過，在存在支配性策略的博弈中，我們選擇支配性策略可以獲得相對較好的收益。因此，弱支配性策略也是我們的首選。在上面的例題中，我們應該選擇「信神」。

說實話，我們不知道現實中是否存在神。不過，通過博弈論的思維方式進行合理的思考之後我們發現，如果神存在的話，信神的收益比較大。如果神不存在的話，那麼信不信神，收益都是一樣的。但是，如果神存在的話，信神有很好的收益；而不信神可能會受到神的懲罰或遭受損失。即使有些人的內心非常強大，不把「失去真和善」當作損失，那最多也只是得0分，不會有正的收益。由此可見，不管有沒有神，還是信神的好處多一些。

第一章　總結

◎博弈論有三個基本要素，分別是「局中人」「策略」和「收益」。

◎局中人為了自己獲得最大的收益而行動，不會產生誤解或設想錯誤。

◎博弈的表述形式有策略型的「收益表」和展開型的「博弈樹形」。

◎在存在支配性策略的博弈中，支配性策略是最佳選擇。

博弈論的基本要素

博弈的種類

根據局中人對信息的掌握情況進行分類

根據利益的總和進行分類

博弈的表述形式

牛肉蓋澆飯屋之類的快餐店，為什麼要降價？

在評價成績的博弈中，如何獲得較高的評價？

相信神好處多，還是不信神收益大？

第一章 總結

第一章　總結