讀古今文學網 > 超越智商:為什麼聰明人也會做蠢事 > 貝葉斯前來救援! >

貝葉斯前來救援!

在輔助溝通案例中所展示的,是考慮備擇假設必要性的科學思維原則,這種原則在現實生活中有著廣泛的適用性。這種推理策略最基本的形式被稱為「反向思維」,這是一種可以被用於解決很多日常問題的心智程序。試想在你的住所附近新開了一家看起來還不錯的餐廳,但是你從未在那裡用過餐。之所以一直沒有嘗試,主要原因是據曾經去過那家餐廳的朋友反饋,那裡的食物味道非常一般。暫且不管他們的評價是對還是錯(也許他們的觀點並不具有代表性,你過度受到他們的評價影響),你在不知不覺中認為這是一家很普通的餐廳,好吃的概率大概只有50%。過了一段時間,當你在髮廊理發時,剛好遇到這家餐廳的老闆。老闆認出你是住在附近的鄰居,於是熱情地詢問你為何從未到過他的餐廳吃飯?慌亂之中,你臨時編了一個很蹩腳的理由應付他。老闆似乎覺察到了你的遲疑與不情願,詢問道:「怎麼了?發生了什麼事情?來過我店裡的顧客有95%都說很好吃呢。」

老闆的這番話能夠打消你的疑慮嗎?你有想去那家餐廳嘗試一下的衝動嗎?老闆的一面之詞能夠證明這家餐廳很棒嗎?

上述問題的答案毫無疑問是一個堅決的「不」。事實上,如果硬要說老闆的這番話對你的態度有什麼影響的話,也許是讓你變得更加不願意去嘗試。很顯然,老闆的說法沒有提高這家餐廳在你心目中的印象。他的推理過程出了什麼問題呢?為何他的說辭並沒有成為證明這家餐廳值得一去的有力證據呢?

18世紀,來自英格蘭坦布裡奇維爾思的教士托馬斯·貝葉斯(Thomas Bayes)提出的定理為這個問題提供了理論性答案[1]。貝葉斯公式基於兩個基本概念:待檢驗的焦點假設(稱為H),以及與假設相關的數據集合(稱為D)。在下面我將要給大家展示的公式中,你將看到這樣的符號:~H(非H)。這個符號代指備擇假設,即如果焦點假設為假,則備擇假設一定為真,兩者是相互排斥的。因此,按照慣例,備擇假設為真的概率等於1減去焦點假設為真的概率。例如,如果我認為魚竿另一端咬鉤的魚是鮭魚的概率為0.6,那麼,這只魚不是鮭魚的概率就是0.4。

接下來的章節是本書中技術性最強、對數學要求最高的一部分。但是,此處的重點與難點並非在於數學公式,而是概念。即使你有數學恐懼症,想要忽視所有的數字和公式,也應該對理念有清晰準確的把握,這是關鍵所在。掌握貝葉斯思維方式,除了一些詞彙規則之外,你並不需要學習太多其他的知識。正規的貝葉斯統計肯定包含計算,但是,為了避免犯概率相關的思維錯誤,你只需要掌握正確進行概率計算思維方式所需的概念性邏輯即可。

在接下來出現的公式中,P(H)表示在收集數據之前估計焦點假設為真的概率,P(~H)表示進行數據收集之前,備擇假設為真的概率。另外,接下來的計算中還牽扯到一些假定概率(條件概率)。例如,P(H/D)代表在對數據(D)模式進行分析之後,焦點假設為真的概率;P(~H/D)代表備擇假設的後驗概率。P(D/H)表示在焦點假設為真的情況下,觀察到特定數據模式的概率;P(D/~H)(下文中將要提到,這是一個非常重要的值)代表在備擇假設為真的情況下,觀察到特定數據模式的概率。需要引起重視的是,P(D/H)與P(D/~H)並非是互補的(兩者相加不為1)。數據有可能同時給定焦點假設和備擇假設,也有可能不給定焦點假設和備擇假設。

接下來,我們將聚焦於貝葉斯公式中理論性最強的一種變形形式,該公式以概率形式呈現:

在這個比率等式中,或者說概率形式公式中,從左至右3個比率分別表示:在獲得新數據(D)的情況下,焦點假設(H)成立的後驗概率;焦點假設概率除以備擇假設概率,被稱為相似率(LR);焦點假設成立的先驗概率。具體來說:

該公式告訴我們,在給定數據集的情況下,焦點假設成立的概率等於兩個概率的乘積:相似率乘以焦點假設成立的先驗概率。即:

焦點假設的後驗概率=相似率×先驗概率

值得引起大家重視的一個問題是,不知道貝葉斯定理,並不意味著這個人一定是非理性的。普通人其實並沒有必要熟記這個公式。問題在於,無論個體的判斷是否遵循貝葉斯定理,人們在做出概率方面的決策時,通常是根據自動化加工做出的推測,實驗室研究所關注的正是這種自動化推測是否符合貝葉斯定理的限制條件。當我們跌倒在地時,我們的身體倒下的軌跡遵循牛頓定律。當我們跌倒時,我們不會有意識地根據牛頓定律進行計算,但是,我們的行為可以被認為是遵循牛頓定律的。同樣的道理,人們在做出判斷時也許並不知道貝葉斯定理,但我們仍然可以將他們的行為描述為符合貝葉斯定理的理性推理。哪怕在人們不瞭解任何貝葉斯公式的有關知識,或是沒有進行有意識計算的情況下,人們的概率判斷也有可能被認為是遵循貝葉斯定理的。

個體的推理偏離貝葉斯定理的形式多種多樣,在接下來的章節中,我將重點關注其中一種[2]。

通常情況下,當人們對證據的可診斷性進行評估時,即評估[P(D/H)/P(D/~H)],常常會忽略掉分母[P(D/~H)]。在焦點假設為假的情況下,人們沒有意識到評估獲得觀測數據概率的必要性。

這是由於沒有想到反例而導致嚴重推理錯誤的理論性原因。好了,現在讓我們回顧一下在開篇中提到的社區餐廳老闆的故事。如果你認為老闆的回答很棒,那麼你跟他犯了相同的錯誤。原因如下:

根據貝葉斯定理,餐廳老闆僅提供了P(D/H)的信息[如果這是一家很棒的餐廳,少於5%的客人會投訴的概率],而忽視了P(D/~H)[如果這是一家很糟糕的餐廳,少於5%的客人會投訴的概率]。他/她希望告訴你一個很高的P(D/H),以提高餐廳的吸引力和你光顧的概率,但是你(正確地)意識到,如果要評估後驗概率,僅僅有P(D/H)是不夠的,因此你並不會被老闆說服。你覺得老闆提供的論據可信度不高,並且,由於老闆沒有提供P(D/~H),你可能還會做出一些其他的假設。在這個簡單的例子中,你能夠認識到獲取P(D/~H)的必要性。換句話說,如果這家餐廳很糟糕,有5%的客人會直接向老闆抱怨的概率是多少?

上述情況如何用貝葉斯公式表達呢?請大家先來回想一下貝葉斯公式的基本形式:

後驗概率=相似率×先驗概率

讓我們假設你收集數據之前估計這家餐廳很棒的概率是0.5,那麼,估計這家餐廳很差勁的概率也是0.5。因此,認為這家餐廳很棒的先驗概率是0.5:0.5,即1:1,用博彩術語來說,就是賭一賠一。

這個例子中的相似率指的是什麼呢?根據老闆提供的信息來看,95%的客人從未抱怨過這家餐廳。因此,可以對此處的相似率做如下表述:

假定這是一家好餐廳,很有可能有95%的客人都不會抱怨、投訴餐廳。事實上,5%的投訴率在競爭激烈的餐飲業中是非常高的,這樣的餐廳很有可能面臨生存危機。因此,95%的客人用餐後沒有任何怨言這一評價指標,超過99%的好餐廳都可以輕鬆達標。餐廳老闆所犯的錯誤在上述公式的分母部分,即P(D/~H)。如果這是一家很差勁的餐廳,超過95%的客人不會抱怨的概率是多少?這裡問題就多了。多數差勁的餐廳並非一如既往得差。另外,多數餐廳之所以收到差評,並非因為顧客對食物有所怨言(那樣的餐廳距離關門不遠了),而是由於這家餐廳的各方面一直都差強人意,或是差於周圍餐廳的平均水準。這些餐廳並非提供令人反胃的食物,而只是「一般般」的餐廳。再考慮到基於社會化因素,當人們僅僅是輕微不滿意時,通常不會公開表示抱怨。也就是說,人們如果在一家很糟糕的餐廳吃飯,雖然心中暗下決心絕對不會再去第二次,但多數人離店時都不會把抱怨掛在臉上或者說出來。這就是為何餐廳老闆提供的95%滿意度的數據並沒有很強的說服力。

如果這家餐廳很差勁,有90%的概率至少有95%的顧客離店時不會口頭表達不滿。當我們把這些數據代入到貝葉斯公式,結果如何呢?

後驗概率=相似率×先驗概率

後驗概率=(0.99/0.90)×(0.5/0.5)

後驗概率=1.1

「這是一家好餐廳」的賠率是1.1比1(這是一家好餐廳的概率已由50%變為52.4%[3])[4]哪怕是最為樂觀的估計,這家餐廳值得品嚐的概率都不大。

餐廳老闆試圖誘惑我們犯思維錯誤。他的伎倆包括以下3步:

(1)製造一個已知數D,以產生很高的P(D/H);

(2)希望對方忽視P(D/~H);

(3)僅僅根據高P(D/H),推測焦點假設的發生概率。

越來越多的研究表明,人們普遍傾向於忽略能夠證明非焦點假設為真的證據。例如,心理學家麥克·多爾蒂(Michael Doherty)及其研究團隊使用一種簡單的範式對這個問題進行了研究。該研究範式讓被試想像自己是一位正在給紅疹病人做檢查的臨床醫生[5]。研究者給他們提供了4條信息,要求被試從中選取一條可以確診病人患有「Digirosa」的臨床證據。這四條信息內容如下:

患有Digirosa的人口比例。

沒有患Digirosa的人口比例。

患有Digirosa的患者中,紅疹患者的比例。

未患Digirosa的患者中,紅疹患者的比例。

這些信息對應於貝葉斯定理中的4個術語:P(H),P(~H),P(D/H)和P(D/~H)。由於P(H)和P(~H)是互補的,所以在計算後驗概率時,實際上只有3條信息是必需的。其中,未患Digirosa的人群中紅疹患者的比率,即P(D/~H),是必選的信息。因為根據貝葉斯定理,它是計算相似率不可或缺的關鍵部分。然而,在多爾蒂及其同事的研究中,48.8%的被試沒有選擇P(D/~H)這條信息。因此,對於很多面臨這個問題的人來說,未患Digirosa的紅疹患者數量與當前問題的解決毫無關係,它被(錯誤地)認為是一件無關痛癢的事。

能夠意識到P(D/~H)的重要性,這並非是默認安裝在大腦中的心智程序,因此,選擇它作為解決問題的必需信息看起來有些「反直覺」。人們必須通過學習而得知這條信息的重要性,否則,默認的信息加工過程會選擇忽略這條信息。因此,那些沒有認識到加工P(D/~H)重要性的人,可以認為他們存在心智程序缺陷。

[1] 更多關於托馬斯·貝葉斯的信息,參見斯蒂格勒的文章(Stigler,1983,1986),關於貝葉斯公式在心理學領域中的應用,參見費詩霍夫的文章(Fischhoff and Beyth-Marom,1983)。

[2] 此處需要格外強調一下,隨著本書的深入展開這個問題會越來越明晰。本章中所討論的這些概率推理問題並非只會出現在實驗室,或是傳說軼事中,也並非只會出現在家庭聚會小遊戲上的錯誤。我們將會看到,這些錯誤出現在一些極為重要的領域,包括金融規劃、醫學決策、生涯規劃決策、家庭規劃、資源分配、稅務政策和保險購買方案等。很多文章對這些推理謬誤在多個領域中的現實意義和價值進行了討論(舠tebro,Jeffrey,and Adomdza,2007;Baron,1998,2000;Belsky and Gilovich,1999;Camerer,2000;Chapman and Elstein,2000;Dawes,2001;Fridson,1993;Gilovich,1991;Groopman,2007;Hastie and Dawes,2001;Hilton,2003;Holyoak and Morrison,2005;Kahneman and Tversky,2000;Koehler and Harvey,2004;Lichtenstein and Slovic,2006;Margolis,1996;Myers,2002;Prentice,2003;Schneider and Shanteau,2003;Sunstein,2002,2005;Taleb,2001,2007;Ubel,2000)。

[3] 這個概率值是通過貝葉斯公式的一種變式計算而來:P(H/D)=P(H)P(D/H)/〔P(H)P(D/H)+P(~H)P(D/~H)〕;P(H/D)=(.5)(.99)/〔(.5)(.99)+(.5)(.90)〕=.5238

[4] P(H/D)=1-P(~H/D),故P(H/D)=1.1/(1.1+1)。——譯者注

[5] 文獻出處:Doherty and Mynatt,1990。