讀古今文學網 > 社會認知:洞悉人心的科學 > 第3章 啟發法:基於經驗和直覺的推理法則 >

第3章 啟發法:基於經驗和直覺的推理法則

假如你剛剛遇到一位藍谷高中的畢業生,她看上去相當傲慢,你是否會認為你遇見的下一位藍谷的畢業生也會如此傲慢呢?你的好朋友在佛羅里達度過了一個愉快的假期,你是否也會愛上佛羅里達呢?對安東尼進行過面試的公司人事部門經理認為他將會成為一個出色的管理者,那麼安東尼會在未來的管理工作中表現出色嗎?

要回答上述任何一個問題,你都需要考慮以下概率:某高中的一個畢業生態度傲慢,該校另一個畢業生也會傲慢的概率;你的朋友喜歡一個旅遊勝地,而你也會喜歡該地的概率;某人在工作面試中有出色的表現,他以後也會在該項工作中表現出色的概率。

我們是如何進行概率推理的呢?這個問題已經受到許多學者的關注。關注的焦點主要放在確認我們的推理弱點上,即一些導致我們無法理解和運用概率法則的方式以及由此帶來的困境。就研究認知偏差及認知錯覺本身而言,不僅極富趣味性而且還十分重要,因為它可以幫助我們瞭解人類是如何進行推理的,正如對視錯覺的研究有助於我們瞭解視覺系統的加工機制。在本章的開始,我將簡要地介紹人類概率推理的歷史,然後探討一些最新的研究——人們在統計推理中存在的問題,以及這些問題對社會事件推理產生的影響。隨後,會介紹一些重要的非統計性推理方法——啟發法,或者說是人們常常喜歡使用的推理法則,而不是那些更為科學的統計原理。本章最後將討論是什麼因素決定了人們有時會選擇使用適當的統計原理,而有時又會採用非統計性策略。

概率推理的歷史

概率理論是一個比較新的知識成果。人類從古代就開始賭博。古時候,人們將動物的膝節骨打磨拋光做成骰子,擲出後它們會以四種方式落下。雖然這種隨機化的工具很流行,但是直到近代,人類才真正理解支配它的原理。哲學家Ian Hacking在他的著作《概率的出現》(The Emergence of Probability,1975)中指出,概率理論在17世紀才出現。Hacking認為,一個人只需懂得些許概率數理知識,他就可以在一個星期內贏得整個古代高盧城。

從歷史上來看,人們很晚才對概率有所認識,這一事實很重要,因為它說明雖然人們每天都會碰到一些不確定的事件,並且這些事件本身蘊含著概率原理,但人們卻並不能自發地從這些事件中獲得概率知識。因此,我們也不必奇怪,即使是現在,人們在進行概率推理時也會遇到困難。也許你會詫異,在這個充滿不確定性的世界裡,在無法完全理解支配著這些不確定性的概率原理的情況下,人類是如何生活的呢?最恰當的解釋就是人類的確形成了對這些原理的基本理解,這足以使我們解決很多推理問題。但是由於理解能力有限,我們還是會犯錯,特別是在思考社會事件的時候。只要仔細考慮一下人類推理不確定事件的能力局限性與人們推理物質世界的能力局限性之間的相似性,你就會更好地理解這一點。人類對物質世界中的概率原理瞭解甚多,所以我們走路時才不會撞牆,開車時才不會撞車。甚至連兒童都能夠準確預測投出的棒球的軌跡,從而使自己跑過去接到它。但是,即使是成人,在推理物質世界的事件時,也會犯系統性的錯誤。例如,第一次世界大戰期間,飛行員常常會將炸彈投擲到轟炸目標的前方,因為他們往往是在飛行到目標的正上方時才投擲炸彈,而不是在之前就投彈,提前投彈的做法才是正確的。這說明他們還不是非常瞭解物質世界,尚沒有認識到從飛行的飛機上投擲的炸彈是不可能垂直降落的。現在的許多大學生對日常生活中的物質現象也有類似的錯誤認識(例如,Kaiser,Proffitt,& McClosky,1986)。所以,我們對日常生活的統計知識有著錯誤的認識也就不足為奇了。

統計知識逐漸發展,到20世紀中期為止,就已經建立了很完備的概率理論。人們廣泛地應用概率理論對不確定事件進行推理,從預測概率遊戲中各種結果出現的可能性,到根據死亡曲線計算合理的養老金。儘管缺乏相關的心理學研究,但大家普遍認為人們在日常生活中的判斷遵循概率理論。實際上,很多現代經濟學理論的預測都是基於這樣一種觀點,即人們理性地使用概率去計算他們可能的經濟得失。

心理學於20世紀50年代開始認真地對概率推理進行研究。諾貝爾獎得主赫伯特·西蒙(Herbert Simon)的研究認為,人們並不總是用完全理性的方式去尋找推理問題的最佳解決方案。他指出,人們在有限理性範圍內執行任務,而非採用令人滿意的最優化原則,即人們尋找的是一個達到目標的足夠好的解決方案,儘管它並不一定是最佳的(Simon,1957)。差不多在同一時期,Paul Meehl比較了臨床醫生以兩種不同的方式得出的推理,即一種是通過整合不同的信息源得出的推理,一種是對同樣的信息進行簡單的統計合併得出的推理,他發現他們的推理中存在缺陷(Meehl,1954)。Ward Edwards與其同事發現,一條重要的概率規則——貝葉斯定理,可以用來評估人們在面對新的證據時修正自身信念的方式。Edwards等人的研究表明,人們採用很保守的貝葉斯法則,即當人們面對新的證據時,如果有必要,人們的確會修正其信念,但並不是大刀闊斧的修正(如,Phillips & Edwards,1966)。

這些理論的發展為20世紀70年代丹尼爾·卡尼曼(Daniel Kahneman)和阿莫斯·特韋爾斯基(Amos Tversky)的突破性研究奠定了堅實的基礎(Kahneman & Tversky,1973)。他們認為,人們對事件進行判斷時,常常根據不同類型的推理啟發法,即拇指規則——依據直覺和經驗的推理方法,而不是不合理地使用統計原理。雖然這些啟發法常常能夠導致有效的推理,但同時也會導致一些系統性的偏差和錯誤。卡尼曼和特韋爾斯基的研究工作激發了大量有關推理方面的研究,這些研究主要探討人們在推理時存在的不足,考察在何種情形下人們容易運用不恰當的非統計性啟發法。Richard Nisbett和Lee Ross在他們的一本重要著作中,詳細說明了這些研究工作對社會性判斷的意義(Nisbett & Ross,1980)。最近,人們對推理不斷有新的認識,除了卡尼曼和特韋爾斯基發現的非統計性啟發法之外,人們對一些基本的統計原理知識也有一定的瞭解。這使得許多研究者去試圖發現是什麼決定了這兩種啟發法——統計性和非統計性的啟發法——在每種情況下的使用(例如,Gigerenzer,1991;Ginossar & Trope,1987;Nisbett et al.,1983)。接下來的部分,我將會介紹卡尼曼和特韋爾斯基提出的幾種重要的非統計性啟發法,討論每種啟發法如何幫助我們理解我們的社會。最後我還會介紹人們有時會使用的一些較為合理的統計性啟發法,以及討論哪些因素會影響人們選擇使用統計性啟發法或不太合適的非統計性啟發法。

代表性啟發法

蘇珊可能是一個民主黨成員還是共和黨成員?傑裡最近常常被女性拒絕,這說明他運氣不好還是說明他人格異常?我們遇到的很多概率性問題都是這種形式:我們通常被告知要判斷一個事例屬於一種範疇的可能性,或是判斷一個事件有多大可能來自於某一潛在過程。卡尼曼和特韋爾斯基認為,當我們回答這些問題時,通常依賴代表性啟發法,即人們通常會根據一個事例在多大程度上能夠代表其範疇,或者該事例在多大程度上與該範疇相似來進行分類。如果蘇珊的表現與我們對民主黨固有的印象相似的話,我們就會認為她是民主黨成員。同樣的道理,我們對事件的歸因也是基於這一事件與促使其產生的過程的代表性程度來進行。我們對人格異常將會產生的後果有某種預期,如果傑裡連續遭拒絕這一結果符合這種預期,我們就會認為傑裡是人格異常患者(Kahneman & Tversky,1972;Kahneman & Tversky,1974)。

代表性啟發法能夠幫助我們在很多時候做出恰當的判斷,因為事例與範疇的相似性能夠很好地說明該事例是這一範疇的成員(參見第2章)。當事例特徵能夠很好地用來判斷該事例是否屬於一個範疇時,判斷一般都是正確的,我們對諸如動物或水果等事物的歸類常常就是如此:某種動物長得像鴨子,走路像鴨子,叫聲像鴨子,那麼它極有可能就是鴨子。但是,有一些範疇,尤其是社會範疇,特徵往往不能作為判斷其範疇成員的依據。一個富有的白人,他對犯罪持強硬態度,這些特徵符合人們對共和黨人固有的印象,但是我們知道,許多民主黨人也具有這些特徵。在這種情況下,如果我們僅僅以代表性特徵作為概率判斷的基礎,就會產生嚴重的偏差。因為概率判斷同樣受到許多其他因素的影響,而這些因素並不會影響人們對相似性的判斷。卡尼曼和特韋爾斯基的研究表明,我們常常會忽略這些因素的影響。接下來我們將討論這些因素。

忽略先驗概率(基礎比率)

思考下面的問題:

威廉是一個矮個子、害羞的男人。他對詩歌充滿熱情,喜歡參觀藝術博物館。孩提時代,他常常受到同學的欺負。你認為威廉是一個:(a)農民;(b)古典文學學者?

根據上面的描述,大多數人都會猜測威廉是一個古典文學學者。畢竟,和農民相比較,對威廉的描述更符合古典文學學者的形象。但是在我們下結論之前,還要考慮一個關鍵信息——基礎比率,即該職業在總人口中所佔的比率。在美國,農民的數量遠遠大於古典文學學者的數量。實際上,即使只有很少比例的美國農民符合威廉的特徵,這部分農民的數量也會比美國古典文學學者的數量多。因此,當我們猜測威廉從事的職業究竟是哪一種時,應該考慮到這種先驗概率。但結果卻是,我們常常忽略或無法充分利用這些先驗概率或基礎比率,而依賴於代表性啟發法。

為了說明人類的判斷通常基於代表性啟發法,而非先驗概率,卡尼曼和特韋爾斯基(1973)設計了一個實驗。在這一實驗中,他們有意識地操縱人們對基礎比率的認識,以考察這一操縱對個體判斷的影響。他們告知參與者,一組心理學家對100名成功人士(包括工程師和律師兩種職業)進行了訪談和測試。基於這些信息,心理學家對他們每個人做了簡要的描述。為了操縱基礎比率,參與者所獲得的信息有所不同。告訴一半參與者,這100位成功人士是由70名工程師和30名律師組成;告訴另一半參與者,這100人由30名工程師和70名律師組成。隨後,從關於這100個人物的描述中隨機抽取一部分,讓所有的參與者閱讀。對於每一個人物描述,要求參與者判斷該描述有多大可能是對一個工程師的描述。這些描述有代表律師職業特徵的,也有代表工程師職業特徵的。其中,一段像工程師的描述如下:

傑克今年45歲。他已經結婚並有四個孩子。他通常比較保守,謹慎而雄心勃勃。他對政治和社會事件並沒有多大的興趣,而將大部分的業餘時間都用在了自己的愛好上,如家中的木工活、航海以及數字遊戲。(p.241)

參與者如何確定此人是不是工程師呢?根據貝葉斯定理,兩個因素會影響這一判斷:(1)在工程師和律師中,能夠找出符合這一人物描述的相對可能性。當然,例子中所描述的特徵更接近於對工程師的描述,也就是說,相對於律師來說,這些描述更能代表工程師的特徵。相對於只具有中等程度代表性特徵的人,那些具有工程師典型特徵的人,更容易被判斷為工程師。[1](2)工程師和律師在這一組人中的先驗概率或基礎比率。相對於工程師人數占總數30%的情況,當工程師人數占總數的70%時,人們勢必會更多地認為上面所描述的人是一個工程師。

但是,根據參與者的反應,他們只利用了代表性因素而忽略了基礎比率,無論告訴工程師占總數的70% 還是30%,其可能性判斷的結果在本質上都是一樣的。可能性判斷是特徵相似性程度的一個函數,而不是基礎比率的函數。這並非由於人們生來就不能理解和應用基礎比率。當沒有給出人格特徵描述時,參與者能夠按照基礎比率判斷一個未知個體有多大可能為工程師(即70%或30%的可能性)。但是,一旦給出人格特徵描述,參與者就不再利用基礎比率信息,而是依賴於人物描述的代表性信息。

這些早期研究結果引發了學者們針對“人們是否利用以及何時利用基礎比率信息”這一問題的大量研究。研究發現,在某些情況下,人們的確會利用基礎比率,但顯然沒有達到貝葉斯定理所描述的那個重要程度(Kahneman & Tversky,1996)。

當基礎比率傳達給參與者某些有意義的因果信息時,參與者更有可能使用基礎比率進行判斷。例如,考試通過率對學生來說就具有顯著的意義——如果75%的學生通過考試,則說明該考試簡單;如果只有25%的學生通過考試,則說明該考試困難。人們都知道簡單的考試比困難的考試更容易通過。換句話說,人們能夠利用這一有意義的基礎比率對學生作出判斷。為了驗證該假設,研究者設計了這樣一個試驗:給參與者看一篇簡介,描述的是一個學生的能力及學習習慣。然後讓參與者評估該學生能通過考試的概率(Ajzen,1977)。事先會將有關的基礎比率信息告訴參與者。對於一半參與者來說,這一基礎比率信息是有意義的,他們被告知有75%(或25%)的考生通過了考試。結果發現,這一部分參與者利用基礎比率作出判斷。在75%通過率的基礎比率情況下,參與者更傾向於認為該學生通過考試;在25%通過率的基礎比率情況下,參與者更傾向於認為該學生沒有通過考試。將同樣的基礎比率信息也告訴另一半參與者,但將這些信息的意義與考試難度分離開。研究者告訴這些參與者,教授對成功(或失敗)的學生非常感興趣,因此選擇了一部分學生,其中75%(或25%)通過考試。結果發現,相對於前一種條件,參與者在這種情況下較少利用基礎比率。顯然,人們會更多地利用有意義的基礎比率,而較少使用看起來像是無關的基礎比率。

一些與卡尼曼和特韋爾斯基的工程師/律師問題相似的研究表明,當概率因素被強調或基礎比率更明顯時,人們傾向於利用基礎比率(如,Bar-Hillel & Fischhoff,1981;Gigerenzer,Hell & Blank,1988;Ginossar & Trope,1987;Krosnick,Li & Lehman,1990;Schwarz et al.,1991)。這些研究或明確或非明確地表明,統計推理似乎可以增加人們對基礎比率信息的使用。關於這一問題,我們會在後面的統計性啟發法中作詳細討論。

上面提到的研究結果,修正了先前關於人們如何利用以及為何沒有成功利用基礎比率的一些理論,但這並不意味著先前的理論不管用了。雖然我們在一定程度上理解了基礎比率的重要性,並且在一定的情況下能夠運用它作出判斷,但是這種理解並不深入、並不穩定,我們很容易受代表性啟發法的誘惑,而忽略或無法充分利用基礎比率,從而導致錯誤。

當我們思考自己或者權威人士作出的一些重要決策時,我們關注更多的是在這之中所犯的錯誤,而且發現本應在這些決策中發揮作用的基礎比率,卻常常被忽略了。許多醫生都沒有意識到,當症狀和醫療檢查都無法很好地預測一種疾病時,對於一名患者是否患上該病的判斷,就會受到當前流行病的影響(Eddy,1982)。敢於冒風險的資本家進行風險投資時,常常沒有認識到,對某個新行業進行投資其失敗率是相當高的。項目規劃者可能沒有考慮到與此類似的項目一般需要多長的時間才能完成。新婚夫婦可能沒有認識到當前離婚率與他們的婚姻能否長久維持有何關聯。有抱負的籃球明星也不能清醒地認識到自己能夠進入NBA的概率。所有這些情況中,未能利用基礎比率,就可能導致他們極大地低估其行為的風險,從而做出錯誤的判斷和決策。

並不是說,當成功率很低時,就絕不要去冒風險。人們常常進行高風險投資、高難度競標以及做出種種冒險行為,這樣做自有其理由。要說的是,人們常常在並未充分認識到風險的情況下就去冒險,或是事先並不知道風險係數有多大,而選擇一些本應該規避的行為。人們沒有認識到相關的基礎比率,所以常常看不到風險。

人們在判斷中常常忽視基礎比率,這一點可用來解釋許多重要的社會心理學問題,例如接下來我們將討論的歸因、刻板印象以及印象形成等問題。

普遍性作為基礎比率 上文探討了人們從對貝葉斯定理的瞭解到對概率推理的理解,這些與許多判斷任務的完成有關,但是,人們在判斷時常常沒有運用它們。在社會心理學中,人們對他人行為的歸因經歷了一個類似的發展過程:最初提出一個標準歸因模式,認為人們在進行歸因時必須充分考慮各方面因素,其後意識到,我們並不總是按照這種標準模式行事。

想想埃裡克在與黛安娜談話後變得十分沮喪。我們應該把它歸因於埃裡克(他本身就是個很抑鬱的人),還是歸因於黛安娜(她讓人變得情緒低落)?Harold Kelly(1976)的歸因協變模型為我們回答這個問題提供了指導(Kelly,1967)。按照Kelly的模型,我們在歸因過程中要考慮三個因素:區別性,即某種結果是否只在特定的原因下才會出現。埃裡克僅僅是在與黛安娜談話後才變得沮喪,還是在與其他任何人談話後都會變得沮喪?一致性,即同樣的結果在同一原因下是否反覆出現。埃裡克每次與黛安娜談話後都沮喪不已呢,還是僅此一次?普遍性,即其他人是否在同樣情境下也產生同樣的行為。是每個與黛安娜談話的人都變得沮喪不已呢,還是只有埃裡克一個人才會如此?

這些因素的不同組合方式會讓我們做出不同的歸因。如果埃裡克和很多人談話後都會沮喪(低區別性),埃裡克與黛安娜談話後總會沮喪(高一致性),而其他人與黛安娜談話後都不會沮喪(低普遍性),我們就可以得出這樣的結論:在這種情形下,埃裡克變得情緒沮喪是他自己的原因。相反,如果埃裡克只是在與黛安娜談話後情緒沮喪,而與其他人談話後都不會這樣(高區別性),埃裡克與黛安娜談話後總是很沮喪(高一致性),並且每個人與黛安娜談話後都很沮喪(高普遍性),我們就可以認為,埃裡克在這種情形下很沮喪是黛安娜的原因;不知為何,她總讓人沮喪不已。

最初,研究者假設人們在歸因時能恰當地應用這三個維度的信息(Nisbett & Ross,1980)。但是,有研究表明,系統地變化這三方面的信息,發現閱讀短文的參與者在歸因時對區別性和一致性信息十分敏感,而對普遍性信息不敏感。例如,一個男人為何會保護他的房子?人們對此歸因時,往往較少關注普遍性特徵信息(是所有其他男人也都會保護其房子呢,還是幾乎沒有男人會保護他的房子?),更多地關注於區別性信息(這個男人是保護所有的房子呢,還是置其他房子於不顧?McArthur,1972,1976)。後來的一些研究也得到了相同的結論,即人們在歸因時較少應用普遍性信息(Major,1980)。

Nisbett和Borgida(1975)認識到,人們在歸因中較少應用普遍性信息的傾向與在分類中較少應用基礎比率的傾向是一致的。其實,普遍性就是一個基礎比率,它反映出人們做出某一特定行為的比率。就像律師在總人口中所佔的比率,會影響我們評估傑克是一個律師的概率;被喬丹絆倒的人數比率,會影響我們評估拉爾夫可能被他絆倒的概率(當然,除非我們有充分的理由預測拉爾夫會或不會被喬丹絆倒。但是對於社會行為,我們卻很少有這種明確的診斷性信息)。人們作出某種行為的概率是我們對此行為進行歸因的一個明確的指標。如果我們預期拉爾夫將會踩喬丹的腳,而且我們知道每個人都會這樣,那麼我們就不能把這種行為歸因為拉爾夫的獨特人格或技能。Nisbett和Borgida推測,人們在歸因時忽略普遍性信息,是因為我們沒能認識到普遍性信息可以用來評估個體某種行為出現的概率。所以就沒能進行統計推理,也就沒有使用基礎比率。

Nisbett和Borgida認為,人們的確沒有意識到普遍性信息的作用。而這種普遍性信息可以說明在一個特定的情境下人們做出某種行為的概率,可以影響我們對特殊個體在此情境中的行為的預期(Nisbett & Borgida,1975)。有一項研究,要求參與者閱讀一個經典的社會心理學實驗,這個實驗考察的是學生從內部聯絡通信系統中得知有同伴癲癇突然發作時,是否能夠及時地救助他們。之所以選擇這個實驗,是因為它得出了一個令人不可思議的結果:大多數參與者都沒有及時去援助他們的同伴。在Nisbett和Borgida的研究中,一部分參與者被告知該實驗的結果,這種“共同反應”的信息應該引導個體準確地進行情境歸因。而另一部分參與者則沒有得到這樣的信息。接下來讓兩組參與者閱讀一些關於幾個學生的簡要描述,告訴參與者,這些學生要參與上述的經典實驗,並讓他們猜測這些學生在該實驗中會作出何種行為。有趣的是,研究結果發現,那些被告知實驗結果的參與者,在做出判斷時並沒有使用“共同反應”這一信息。他們的預測與那些沒有得到“共同反應”信息的參與者所做的預測沒有顯著差異。儘管參與者已經知道在經典實驗中大多數學生都沒有及時救助同伴,但還是傾向於認為他們看到的那些平凡普通的學生會及時援助同伴。也就是說,他們在做出推理時忽略了基礎比率,而常常運用代表性啟發法。由於所描述的這些普通人的形象更接近於親切、樂於助人,而非冷酷無情,所以參與者認為他們能夠迅速地對同伴施以援助。

人們在預測個體可能出現的行為時不運用基礎比率,這似乎是一件不可思議的事情。前文曾論述過,當基礎比率信息是有意義的因果信息時,人們才會加以利用。我們利用考試通過率這一基礎比率來推斷某個學生通過該考試的概率,因為通過率決定著考試的難度(Ajzen,1977)。普遍性信息也非常重要,它說明了情境的重要性。在相同情境下,個體有著同樣的行為,表明情境對行為有重要影響。可是,為什麼我們不能根據重要的情境條件來推斷個體的行為,就像我們能夠根據試卷的難易程度來判斷學生們是否能通過考試一樣呢?社會心理學研究中的一個重要理論揭示了其原因:人們總是低估環境對行為的影響(Ross & Nisbett,1991)。人們傾向於認為行為主要受到潛在人格因素的影響,然而卻並沒有意識到,即使是微小的環境變化都可能會使行為產生戲劇性的變化(Joans & Davis,1965;Ross,1977;詳見第9章)。在不知道情境如何影響行為時,普遍性信息更應該被看做一個重要的基礎比率,甚至應高過有意義的、傳達因果關係的信息。

雖然人們承認普遍性信息在預測陌生人行為時有重要作用,但大多數人在預測自己或朋友的行為時卻不願採用這一重要的普遍性信息。你可能想說:“我並不在乎別人是怎麼做的。我確信自己與別人不同。別人的行為不可能對我(或我父母、朋友)的行為有預測作用。”這樣的想法也許有其道理,但正是這些直覺往往讓我們犯錯。Vallone等人(1990)做了這樣一項調查,讓學生預測自己及室友在一段較長時間內(大學四分之一的時間或一整年)的行為。該預測包括學校環境中大量重要的行為,如學業(是否會掛科,申請哪個專業)、社會生活(是否會與男/女朋友分手,是否會與室友關係更加親密)、家庭關係(是否會特別想家,暑假是否回家)以及課外活動(是否為不久後將要舉行的選舉投票,是否參加大型比賽)。通過比較參與者所預測的行為及他們在這段時間內真實的行為,研究者評價參與者預測的準確性。

該實驗設計可以考察如下假設:人們依據有關自我的密切而廣泛的信息做出預測的準確性,要勝過從人口基礎比率角度所做出預測的準確性。假設其實並不成立。無論是對自我還是對室友,違反基礎比率所做出的預測,其準確率都相當低。一項研究表明,當人們用基礎比率進行預測時,即當人們認為自己的行為與大多數人一致時,預測的準確率高達78%;反之,不用基礎比率進行預測,即認為自己的行為會與大多數人不同時,預測的準確率只有50%。當分析的焦點僅僅集中在高基礎比率項目上時,即至少有75%的同學會做出同樣行為的項目上,最終得到的結果更加有趣。對於這些項目,根據基礎比率進行預測的準確率高達88%,而不根據基礎比率的預測其準確率只有28%。我們看到,在基礎比率很極端的情況下,就算參與者不根據先前對自己和室友的瞭解,僅僅只是簡單地根據大多數人的行為來預測自己或室友的行為,其預測的準確概率也會相當高。

我們不能指責參與者不使用基礎比率,因為他們可能完全沒有意識到這些基礎比率。這些研究結果清楚地說明,基礎比率無疑可以用來預測我們的行為。當你預期自己的行為會與眾不同時,你就該認識到自己正冒著犯一個大錯誤的風險。

刻板印象作為基礎比率 人們腦中常常會有這樣的刻板印象:男人都比女人自信。Anne Locksley和她的同事認為,這種或者其他的刻板印象都可以看成是基礎比率(Locksley et al.,1980;Locksley,Hepburn & Ortiz,1982)。上面提到的刻板印象反映了男人可能比女人更自信,或者說自信的男人在人口中所佔的比率高於自信的女人所佔的比率。也就是說,刻板印象就是一個基礎比率,它定義了先驗概率,即任何群體成員的特徵都與其所屬組群的固有特徵相關。因此,刻板印象應該發揮基礎比率的作用。回顧之前所討論的,當人們對某個人一無所知時,會利用基礎比率對此人做出判斷;但是如果閱讀了關於此人的簡短描述,就會僅僅只根據描述中的代表性特徵對他做出判斷,而忽略或無法充分利用基礎比率。Locksley和她的同事發現,與基礎比率一樣,人們也常常使用或忽略刻板印象。

Locksley等人做了一項關於男人比女人更自信這一刻板印象的研究。參與者首先閱讀幾個男女的一些不同類型的信息,然後讓他們判斷這些個體的自信程度。有些描述僅僅只給出了個體的名字,在這種情況下參與者往往會利用刻板印象:叫保羅的人一定比叫蘇珊的人更自信。另一些信息不僅有姓名,還有能表明其自信的行為描述,例如某個描述如下:

不久前,南希想在課堂上對正在討論的問題陳述一些她的觀點。但是另一個同學卻對此誇誇其談,不讓其他人有發言的機會,因此她必須打斷這個學生的發言才可以陳述她自己的觀點(Locksley et al.,1980,p.827)。

一半參與者讀了以上描述,而在另一半參與者閱讀的描述中,南希換成了一個男性名字(如湯姆)。儘管一半參與者讀到的是男性名字,另一半參與者讀到的是女性名字,但是他們都看到了對其行為的描述,因此在做判斷時並沒有用性別刻板印象:認為做出相同行為的南希和湯姆都很自信。這樣看來似乎是,當給出具體行為信息時,我們完全根據代表性啟發法做出判斷。我們對個體是否自信的判斷,僅僅只基於描述中能夠表明其自信的行為信息,而沒有考慮到個體自信的先驗概率,這一概率也就是在缺乏他人行為信息的情況下我們贊同和使用的刻板印象。

雖然在此情形下人們忽略刻板印象會導致推理誤差,但Locksley和她的同事們也指出這種錯誤帶來的益處:人們所持的許多刻板印象都是不準確且毫無意義的。我們很高興看到,當人們掌握了一些行為信息後,就不會採用這些不利的刻板印象去推斷別人。相對於熟悉的人,偏見更容易影響人們對陌生人的判斷。

Locksley和她的同事們在最初的研究中探索了刻板印象如何影響個體印象的形成。這一研究及其意義會在第8章詳述。迄今為止,只有Locksley等人早期的研究證實,人們通常不能將刻板印象這種先驗概率與行為信息結合起來。但不容樂觀的是,刻板印象仍然可以通過其他途徑來歪曲人們的判斷。例如,刻板印象可能會歪曲我們對個體行為的理解(Kunda & Thagard,1996)。

稀釋效應 對於完全不瞭解的人,我們常常會用刻板印象對其進行評價,但是只要掌握了個體的一些額外信息,即使我們認為這些信息與當前判斷完全無關,刻板印象效應也會被降低甚至消除。如果僅僅只給出個體的姓名,人們就會判斷保羅比蘇珊更自信(Locksley et al.,1980)。但如果提供一些與自信毫無關係的信息,比如,那個人的母親“在某個城市的一家銀行工作,年薪2.4萬美元,每天上下班往返時間為1個小時”,這些無關信息也會削弱刻板印象對判斷的影響。人們認為,如果兩個人的母親均在銀行工作,保羅並不比蘇珊更自信(Hiltonh & Fein,1989)。這個例子說明,無關的或次要信息會削弱那些我們認為的重要信息(本例中的性別)的作用。

Nisbett等人把這種現象命名為稀釋效應,即次要信息能削弱重要信息的作用(Nisbett,Tukier,& Lemley,1981)。例如,判斷一個社會工作者是否會虐待兒童,提供給參與者一些與此相關的暗示信息,如他有性虐待傾向、酗酒,然後讓參與者判斷這個男人是否真的有虐待兒童的傾向。結果很明顯,大部分參與者都給予了肯定的答案。但是另外一些參與者,除了得到這些相關信息以外,還得到一些與該判斷完全無關的信息,如該人經營了一家五金器材店,他的IQ為110。結果發現人們認為他是兒童虐待者的比率降低了。也就是說,在人們的判斷中,次要信息的確能夠削弱重要信息的作用。

Nisbett和他的同事們認為,稀釋效應產生的原因在於人們對代表性啟發法的依賴。關於保羅或蘇珊的次要信息減弱了他們與性別刻板印象的相似性,究其原因在於,任何不屬於性別刻板印象的個體特徵,都會減弱個體與刻板印象群體的相似性。同樣地,關於社會工作者的次要信息,也降低了他與兒童虐待者兩者之間的相似性。我們難以想像,一個有著正常、普通屬性的人會是邪惡的,因為我們所認為的邪惡就是純粹惡毒的形象。

上文論述了人們在做判斷時,如猜測某人的職業、解釋某人的行為或形成對某人的印象時,常常會忽視或不能充分利用基礎比率信息,而是依賴代表性啟發法。下文將討論人們在使用代表性啟發法時,總會忽略的一些其他統計信息。

忽視樣本大小

思考下面的問題(Tversky & Kahneman,1974,p.1125):

某個鎮上有兩家醫院。較大的那家醫院,每天大概有45個嬰兒出生;較小的醫院,每天大概只有15個嬰兒出生。我們都知道,男嬰的出生率大約為50%。但是,確切的比率每天都會不同,有時高於50%,有時低於50%。

在一年之中,每家醫院都會記錄下男嬰出生率超過60%的那天,你認為哪家醫院擁有這樣記錄的天數多一些呢?

a.大醫院?

b.小醫院?

c.一樣多?(也就是,兩家醫院記錄天數之間的差別不超過5%)

結果,大多數參與者都認為兩家醫院男嬰出生率超過60%的天數是一樣的。這反映出人們對樣本大小這一重要因素的忽略。事實上,小樣本要比大樣本更容易偏離總人口均值。因此,對於總人口中男嬰的平均出生率為50%來說,小醫院應該比大醫院更頻繁地偏離該出生率。人們錯誤地認為兩家醫院的男嬰出生率超過60%的天數是一樣,很有可能是基於代表性啟發法。他們沒有考慮醫院的大小,認為60%和50%有同等的相似性。如果只是以相似性或代表性作為判斷基礎,那麼就會認為兩家醫院偏離人口均值的概率是一樣的。

隨後的一些研究認為,在某些情境下,人們能夠意識到樣本大小的重要性,就如同人們有時也會使用基礎比率進行推理一樣(Nisbett et al.,1983)。但是,人們對樣本大小重要性的理解同人們對基礎比率的理解一樣,都是不穩定的,因此很容易將它遺忘。這為我們的社會判斷帶來一個重要啟示,人們不能僅憑與別人一時的接觸就去推測他長期的行為。僅僅用一面之緣得到的印象去推測其潛在人格特徵,便會錯誤地把短暫相處所獲得的印象與長期深入瞭解後獲得的信息相提並論。

試想一下,一個你非常信任的同事向你推薦和他一起共事多年的約翰,並且告訴你約翰是個非常能幹且富有效率的經理。但你自己在對約翰進行了一小時的面試後發現,約翰並沒有出色的管理技能。如果你堅持自己的評價,就如我們大多數人在這種情境中所做的一樣,可能你就應該停下來考慮一下,你的印象和你朋友的印象兩者所暗含的樣本大小。你的印象只基於約翰在這一個小時裡的行為,而你朋友的印象則是基於成百上千個小時。約翰在短暫面試中所表現出來的行為以及他給你留下的印象,相比給你朋友多年來留下的印象而言,很有可能是失常的。除非你有理由懷疑你朋友的誠信度或把握人才的能力,否則你就應該認為你朋友對約翰的印象要比你準確得多。

對概率的誤解

當我的兩個兒子為看什麼電視節目而起爭執時,總會用擲硬幣的方式解決。有時連續擲三次,大兒子都輸,他便開始抱怨這枚硬幣更喜歡他的弟弟。我們可能會認為7歲孩子的這種邏輯十分可笑。但當我們意識到,自己的大多數行為,都如同擲硬幣和玩賭博輪盤一樣採用隨機策略時,我們就不會再覺得7歲孩子的邏輯可笑了。我們可能並不樂於發現我們常常表現得好像隨機化儀器,如硬幣和賭博輪盤,認為它們似乎應該具有類似於人的認知能力。例如,人們相信在擲硬幣時(H代表正面,T代表反面),順序是H-T-H-T-T-H要比順序是H-H-H-T-T-T更容易出現,而事實上兩種順序出現的概率是相等的。我們之所以會出現這種錯誤的判斷,是因為第一種順序看上去更隨機。也就是說,這種順序更能夠代表投幣的隨機過程(Tversky & Kahneman,1974)。人們錯誤地認為,即使只擲幾次硬幣,這一隨機過程也會自己表現出來。

在賭場,如果你在一個輪盤旁花費一些時間,就會發現其操作中存在同樣的錯誤。如果你等的時間足夠久,就會碰到出現一系列的紅牌。當一系列的紅牌出現時,下一局就會有更多人把賭注押在黑牌上。為什麼在一系列紅牌出現後,大多數人會認為下一張一定是黑牌呢?人們錯誤地認為這時出現黑牌才是合適的。人們都認為,出現一系列紅牌後,如果再出現一張黑牌而不是一張紅牌,就更能夠代表潛在的隨機過程。人們在紙牌遊戲中所犯的錯誤就和我7歲兒子的幼稚想法一樣。出現三張紅牌接著出現黑牌的概率與三張任意順序的紅和黑的牌出現後接著出現黑牌的概率是一樣的,都為50%。

對概率的誤解會導致人們認為,歷經了一系列好運的人接下來就會倒霉。或者認為,因為他的不幸,才會經歷一系列倒霉的事情。同樣地,如果一棟樓裡有幾個僱員得了癌症,我們就會認為整棟樓都不安全。我們並不知道,在這樣一個充滿不確定的世界裡,偶然的成功、事故及疾病,都是隨機的。體育迷們所迷信的“熱手現象”就是對這種誤解的最好說明。

“熱手”信念 籃球評論員及球迷都普遍相信,球員們偶爾經歷了“熱手”後,便會成為“得分投手”。這一假設是,球員在幾次投籃命中之後會變得自信和放鬆,因此在接下來的投籃中更容易成功。的確,Thomas Gilovich、Robert Vallone 和Amos Tversky(1985)在詢問了100個內行的球迷後發現,91%的球迷認為一個球員在前面兩三次投籃命中後,其接下來的命中率要比之前連續失誤兩三次後再投籃的命中率高,84%球迷認為應該把球傳給已經連續投進幾個球(2個、3個或4個)的球員。

然而,Gilovich等人猜測,這種“熱手”信念來自於對概率的誤解。試想某個球員的投籃成功率在50%上下。這個球員偶爾連續投進4個球或更多,就如同拋一枚硬幣偶爾連續4次或更多次出現正面一樣。重要的問題是:相比於拋硬幣,這種連續命中的現象會更多地發生在一個投籃命中率為50%的球員身上嗎?更進一步說,相對於沒有投進一兩個球的情境,在連續投進1個、2個或3個球的情境下,球員接下來是不是更容易投進球呢?“連續命中”的概率是否比隨機概率所預期的更高呢?答案當然全部是否定的。

Gilovich等人對費城76人隊在整個賽季的投籃記錄進行一系列分析後發現,球員的連續命中率與總體投中概率並沒有顯著差異,球員在連續投中多個球後,再次投籃時命中的概率,並不比其投失多球後再次投籃的命中率高。一個球員是否能投中並不依賴於他之前的表現,就如同拋一枚硬幣,它落地後是否為正面並不依賴於之前它出現的是哪一面。當然這並不是說投籃成功率完全依賴概率。一個高水平的運動員當然會比一個低水平運動員更容易投進球。但問題在於,對於這兩名運動員來說,下一次投籃成功的可能性並不受他們之前表現的影響(當然命中率會受到他們整體能力的影響)。

這種錯誤的“熱手”信念會讓人們付出代價。如果隊員們只把球傳給“熱手”球員(他們完全相信他們應該這樣做),而不傳給那些能力相當同時又沒有被嚴密防守的球員,就會影響球隊的成績。

一些著名的籃球教練對Gilovich 等人的研究結果作出的反應也充分說明,人們不能很好地理解概率在產生連續事件中所起的作用。波士頓凱爾特人隊的Red Auerbach聲稱:“這小子是誰?他是做了一項研究,但我才不關心。”印第安那步行者隊的著名教練Bobby Knight同樣滿不在乎:“……投籃是否命中存在諸多變數,這一研究沒有任何意義。”這些教練不僅沒有意識到概率因素的重要性,他們對“熱手”信念毫無根據的強烈信仰,也使得他們本能地抵制挑戰這一現象的證據。

未能理解回歸

你的考試成績受到你所掌握的有關知識的影響,同時也受到一些偶然因素的影響:可能你很幸運,與測試題目相關的知識你都掌握了;可能因為頭痛使得你在考試時沒有發揮好。如果分數極高或者極低,我們就能夠據此推測你的成績在多大程度上受到概率的影響,即概率因素是幫了你還是害了你。如果你的成績非常好,那麼除了能力,你可能還碰上了好運氣;如果成績很差,那麼你可能碰上了霉運。所以,你真實的能力可能並不如你在考試中所表現得那麼好,而且你在類似考試中的表現也不會總是那麼好。但不同的是,每當測驗分數或多或少受到概率的影響時,人們可能會偶爾考得非常好,但總的來說,在其他時候就不會考得這麼好;偶爾會考得非常差,可能在其他時候就不會考得這麼差。當考出極好或極差兩種極端分數後,可以預期其隨後的考試成績會更加接近平均分數,即所謂的“回歸平均數”。這一根基穩固的統計學原理卻高度違反我們的直覺。

特韋爾斯基和卡尼曼(1974)描述了以色列的飛行教官認為他們應該避免過度讚揚出色的表現,而應該批評差的表現。這一信念與學習的強化理論完全相反,該學習理論認為表揚比批評更有效。教員們開始時表揚那些著陸很平穩的學員,並批評那些著陸不佳的學員,隨後他們發現,那些受到過度讚揚的學員,其成績會下降;而上次表現差勁的學員卻因為嚴厲的責罵,其成績變好了。但是教官並沒有意識到,他們所看到的只是學員的表現向平均數回歸。無論教官表揚還是批評,表現好的學員都可能在下一次行動中表現得較差,反之亦然。

對於人們無法理解“回歸平均數”這一現象,卡尼曼和特韋爾斯基(1973)還提供了更多實驗證據。例如,即使告訴人們,一個關於集中注意力的測試是受到很多隨機因素(如情緒、疲勞程度等)影響的,而且僅僅只能部分地預測總體GPA,但人們還是會認為注意力測試分數極端者的GPA分數也會是極端的,他們的預測是非回歸性的。卡尼曼和特韋爾斯基假設,這是因為人們的預測基於代表性啟發法,即認為結果(GPA)的極端性應該表現出預測指標(注意力測試分數)的極端性。

不理解統計回歸現象還會帶來一種令人困擾的結果,當我們注意到某種模式遵循“回歸平均數”時,就會試圖構造出因果理論來解釋這種現象,就像那些飛行教員一樣。我們可能會成立一個專門的委員會來確定為何公司會失去那些沒有充分發揮其潛力的優秀候選人;也可能建立心理學理論來解釋為什麼有些孩子不如他們的父母聰明,或大學新生在第二年的表現往往不如第一年(Fong,Krartz,& Nisbett,1986),還可能在一些看似能夠提高差生成績的教學程序上過度投資。但人們卻沒有意識到,所有這些現象其實只是遵循“回歸平均數”的規律而已。

合取謬誤

思考下面的問題(Tversky & Kahneman,1983,p.297):

琳達,31歲,單身,坦率直言,性格開朗。她的專業是哲學。當她還是學生的時候,就非常關注歧視和社會公正問題,並且參與過反對核武器的遊行。以下兩個選項哪個可能性更高:

a.琳達是一個銀行出納員

b.琳達是一個銀行出納員,同時也是一個活躍的女權主義者

絕大多數人都選擇了第二個選項。在特韋爾斯基和卡尼曼的實驗中,85%的參與者都做出這樣的選擇。但這一答案卻違反了概率的基本原則。概率理論認為一個合取的概率,即兩個獨立事件同時發生的概率不可能高於單個事件發生的概率。因此,琳達既是個銀行出納員又是個女權主義者的概率不可能高於她僅僅只是個銀行出納員的概率。更簡單地來說,所有符合以上描述的女權主義的銀行出納員,必然包含在所有符合這些描述的銀行出納員之內。而人們卻沒有認識到這一定理,特韋爾斯基和卡尼曼將這種現象稱為“合取謬誤”。

人們對代表性啟發法的使用,可能導致這種合取謬誤。琳達與人們心中女權主義銀行出納員的形象更相似,而不只是一個銀行出納員。如果我們僅以這種相似性作為判斷的依據,那麼就會認為琳達更像一個女權主義的銀行出納員,而不僅僅只是一個銀行出納員。我們陷入這種困境是因為:當對琳達的描述越詳細,越符合女權主義者的特徵時,琳達的代表性特徵增加了,而合取概率卻在下降。

合取謬誤還會影響到我們如何評估對某個結果的不同解釋,即孰優孰劣。在一項研究中,讓學生判斷約翰為什麼會選擇達特茅斯大學,這些學生不會認為約翰這麼做是因為他喜歡達特茅斯的男女比例。但是當這個不可能的原因與一個可能的原因結合在一起時(約翰選擇達特茅斯大學是因為這所大學很有名望,並且他也喜歡該大學的男女比例。),參與者認為,這種結合的原因比單獨的原因更有可能成立(Leddo,Abelson,& Gross,1984)。當然,這違反了概率理論。喜歡某校的男女比例作為選擇大學的理由是不合理的,但喜歡男女比例和想上名校兩者結合的概率更小。然而,兩種理由的結合卻更能代表我們對擇校(理由)的解釋,因此我們會判斷該理由更有可能成立。

上文簡單概述了人們在使用代表性啟發法這一策略進行推理時存在的各種問題。當人們使用這種策略而忽略或者無法充分考慮重要的統計信息(如基礎比率、樣本大小)以及無法理解概率理論的重要原理(如合取原則)時,就會出現嚴重的推理錯誤。

統計啟發法

試想一下,如果有人說:“我真不明白,我有9個孫子,全部都是男孩”,你會做何反應。你可能會認為這個陳述完全可以理解,不過是一個好奇者在尋求解釋。但如果這個人說:“我真不明白,我有3個孫子,全部都是男孩。”你可能會覺得這種說法真是少見多怪,並向這位老人解釋,這種結果僅僅只是概率造成的,並沒有其他原因。Nisbett等人(1983)認為人們在這樣做時,表現出的是有效的統計性直覺。

特韋爾斯基和卡尼曼早期的研究認為,基礎統計概念完全“不屬於人類的直覺”(1974,p.1125);這一陳述有些誇大其詞。後來的研究發現,人們確實瞭解一些基本的統計原則。Nisbett等人把這種簡單有效的統計方法稱為統計啟發法。不幸的是,人們並非總能在需要的時候使用統計啟發法。舉例來說,上面提到的“孫子問題”,以及卡尼曼和特韋爾斯基先前描述的“醫院問題”,想想這兩個問題之間的差別。雖然大多數人都知道,關於性別組成,小樣本遠不及大樣本有代表性,但大多數人還是不能用這一統計原則解決醫院問題。在這種情況下,我們沒能認識到小醫院比大醫院會出現更多的偏離樣本。因此,儘管我們的直覺中包括一些相當複雜的統計啟發法,但在需要利用它們時仍然發現這些直覺還不夠完善。

接下來的問題是:什麼因素決定著人們在遇到問題時是使用統計啟發法,還是使用非統計性啟發法?什麼因素讓我們認識到統計原理與某些概率問題的相關,而不是另一些問題?對這些問題至今都沒有完善的答案。但有些影響人們選擇不同啟發法的重要因素已被確定下來,接下來我們將詳述這些因素。

影響人們選擇何種啟發法的因素

面對一個特定的問題,人們選擇使用何種啟發法,依賴於人們對該事件本質的認識,以及所具備的統計學常識。人們通常擁有一些相互矛盾的信念,並且擁有可以支配的多種相關啟發法,還有那些能夠讓人們形成某種特定信念或通達某種規則的背景信息,這些都會影響人們對啟發法的選擇。

我們在某個領域中的核心知識,涉及我們認為到底何種因素(力量)主宰該領域中的事件。例如,試圖預測一個學生在標準測試中的表現時,我們可以從學生的學術能力、動機、焦慮、學校的教育質量、家庭教育和一些偶然因素等多方面進行考慮。對影響該事件發生的概率的認識在這裡起到了關鍵作用,因為在某一領域中運用統計思想,最重要的一步就是要認識到概率在該事件產生中所起的作用。人們是否能夠認識到事件是受概率影響的,依賴於人們所擁有的相關領域的知識,能夠凸顯概率因素或其他因素重要性的背景線索,以及人們所掌握的基本統計知識(Nisbett et al.,1983)。接下來將會逐一討論這些因素。

相關領域的知識

概率因素在許多領域中發揮著重要作用。學術考試的成績,體育比賽的結果,以及各種社會場合中的人際交往行為,都會受到一些穩定因素的影響,如個體潛在的能力和人格特質;但是,它們也會受到一些偶然因素的影響,如是否正好遇上頭痛、是否將要去度假、是否捲進家庭糾紛之中。對這些偶然因素作用的認識,依賴於這一領域本身的性質,還依賴於我們在這一領域所積累的經驗。

領域內樣本空間的清晰性 在某些領域中,我們可以很容易地將大量事件劃分成清晰的單元,並且很容易地對每個單元進行評分。在學術方面,一個測驗就是一個自然的單元,而且每個測驗的分數都清清楚楚。同樣,在運動會中,各項比賽形成各種單元,比賽結果也顯而易見。在這些客觀領域中,很容易追蹤到重複的分數——重複測驗的成績,再次比賽的結果。這種觀測是理解概率在事件發生中起作用的第一步,也是理解相關推論統計的第一步。但是,在交互作用的社會中,如何對事件單元化或評分,常常沒有那麼清晰。例如,構成友誼的單元是什麼?即使人們可以人為地劃分一些單元,如一次交談、一小時的相處,但是我們如何對友誼進行評分呢?採用每分鐘微笑的次數嗎?即使是這種看似客觀的評分也會出錯,因為不是所有的微笑都像征著友誼。在這些主觀領域中,單元化和評分相對困難,概率的作用也不太能夠清楚地看到,統計推理也更不太可能。

有研究支持這一觀點,證明人們在回答客觀問題如體育、能力等問題時更傾向於給出統計性答案;而對主觀領域中的問題,如個體喜好和人格評估,則較少作出統計性回答(Jepson,Krantz,& Nisbett,1983)。例如,同樣的參與者,在遇到客觀領域的事件時(如體育比賽),他們會認為大樣本比小樣本更可靠;而在面對主觀領域的事件時(如個體對課程的評估),他們就不太明白大樣本仍然比小樣本可靠。另外一項關於人們使用基礎比率的實驗,也得出了相似的結果。面對卡尼曼和特韋爾斯基最初的工程師/律師問題時,參與者沒有使用基礎比率;但是當同樣的問題以一種卡片遊戲的形式再次呈現,每張卡片的一面提供個人的職業,另一面則是他的人格概述,這時參與者卻利用了基礎比率(Ginossar & Trope,1987)。在卡片遊戲中,樣本空間是明確的,概率的作用是明顯的,因此就更容易做出統計性推理。

相關領域經驗 對那些受概率影響的事件,人們對該事件所屬領域越熟悉,就越能理解概率的作用,那麼在思考問題時也就會更多地應用統計性啟發法。即使是在概率的作用相對容易觀察的領域,如體育比賽,人們也要在多次觀察結果後才能完全理解概率的作用。有經驗的運動員比新手更有可能認識到,運動員在不同場合下的表現有好有壞,難以預測。

如果以上直覺正確的話,那麼相關領域的經驗,就可以促使人們更傾向於使用統計性推理解決該領域內的有關問題。一項研究考察了這種假設,給一部分參與者提出一個關於體育比賽的問題:讓參與者解釋為什麼足球教練所選擇的球員在練習賽中表現完美,但到了真正比賽時其發揮卻差強人意。這一結果能夠用“回歸平均數”來解釋。大多數有運動經驗的參與者,其解釋都反映出了這一統計原理:練習中的完美表現並不一定能夠代表球員的平均能力,他們可能只是剛好在練習賽中表現得比平時好(Nisbett et al.,1983,p.354)。相反地,那些沒有運動經驗的參與者則對這一結果採用了非統計性的因果解釋,如最初表現很好的運動員故意鬆懈,以免遭人忌妒;或是他們不想做出很大努力,而只是想依靠他們的天賦度過整個賽季。

給另一部分參與者的幾乎是同樣的問題,只是稍做修改,使該問題與表演有關:讓參與者解釋為什麼有些演員在試演中的表現好過正式演出。此次的結果也一樣,是否有演出經驗決定了答案的差異:大多數有演出經驗的參與者偏好統計性解釋,而沒有經驗的參與者則偏好非統計性的因果解釋。

雖然結果顯示,相關領域經驗促使人們更多地使用合理的統計性啟發法,但同樣要知道,對於那些本身就不太容易做出統計性推理的領域,經驗的幫助並不大。我們對社會交往非常有經驗,但在這些社會情境中,我們對於概率的作用仍然難以理解,可能是因為社會事件難以單元化和評分。

在人們非常熟悉的領域中,這種熟悉性也會受到特定樣本大小的限制。例如,有2個、3個和4個孩子的家庭,我們對性別在他們之間的分配很熟悉,因此僅根據概率,我們知道相比於較多孩子的家庭,只有2個孩子的家庭都是男孩或都是女孩的比率要更高。然而,這種對概率作用和樣本大小的認識卻不能擴展到我們不熟悉的更大的樣本中。回想前文所述,大多數人都不能意識到,與每天有45個嬰兒出生的大醫院相比,每天有15個嬰兒出生的小醫院其男嬰出生率偏離人口性別常態的天數要多(Tversky & Kahneman,1974)。但是,將這一醫院問題稍做調整,如小醫院每天僅有2個嬰兒出生(而不是之前的15個),然後讓參與者回答哪家醫院擁有100%男嬰出生率(而不是先前的60%)的天數多,參與者就能夠更好地使用統計原理判斷。在一項研究中,給參與者這一修改了的材料或是原始的材料,結果發現,能夠運用合理的統計性啟發法並且認識到小醫院比大醫院更容易偏離常態,以及能夠這樣做出正確回答的人數所佔的比例在原始的問題情境下為31%,在修改後的問題情境下則上升到76%(Pelham & Neter,1995)。修改後的問題更加簡單明瞭,因為人們對樣本大小為2個孩子時都是男嬰的情況,比樣本為15個孩子時60%為男嬰的情況更熟悉。如果人們對後者的樣本比較熟悉,就會認識到在特定大小的樣本中,概率對樣本的構成起決定性作用。

背景線索

人們選擇使用何種啟發法還受到問題性質或情境的影響,在能夠凸顯出概率特徵的問題和情境下,人們更容易選擇統計性啟發法。我們會推測別人認為什麼規則更加合理,這種對別人的假設會影響我們的推理;人們更可能使用那些別人認為合理的啟發法。

概率因素的顯著性 那些能夠提醒我們運氣或概率作用的信息,更容易使我們使用統計啟發法。一項研究發現,參與者能夠認識到大樣本調查(基於對學校幾個月的觀察)比小樣本觀察(基於一天的訪問)更具代表性,儘管告訴這些參與者小樣本也是隨機抽取的。這些信息似乎提醒了人們,小樣本更多地受到隨機概率的影響(Nisbett et al.,1985)。

對隨機選擇性的強調也可以提高人們對基礎比率的使用。回顧卡尼曼和特韋爾斯基(1973)的律師/工程師問題,給參與者關於某人的描述,讓參與者猜測此人的職業,並告訴參與者此人是從一個樣本中隨機抽取的,樣本是由70名律師和30名工程師或30名律師和70名工程師組成,在這種情況下,參與者常常會忽略基礎比率的使用。隨後的研究試圖強調這樣一個事實:這些描述是隨機選擇的(Gigerenzer et al.,1988)。這一次讓參與者自己從樣本中抽取人物描述,一次抽取一個。實驗結果顯示,經歷了這一強調概率因素過程的參與者,比僅僅告知為隨機抽取的參與者更多運用基礎比率做出判斷(儘管在高顯著性條件下的參與者仍然未能充分利用基礎比率)。這說明提高概率因素的顯著性,就能增強人們對統計性啟發法的意識。

對交談意圖的假設 在日常談話中,人們運用特定的交談規則,並且利用這些規則去理解別人所說的意思(Grice,1975)。例如,我們假設一個講話者所傳遞出來的是相關且有意義的信息,因而照此解讀它(Schwarz,1994)。然而,在心理學實驗的情境中,常常違背這些規則。在一個關於判斷的研究中,實驗者不停地向參與者傳達一些實驗者自己認為是多餘的或毫無價值的信息,以此來觀察參與者如何看待和處理這些信息。如果參與者錯誤地假定常規交談規則適用於實驗背景,那麼他們就會推測,實驗者認為這些信息與他們後面要做的判斷是相關的和有用的,參與者就可能會做這樣的推理:“如果主試給我一個詳細的關於某人的人格描述,那麼他一定是想讓我在對此人做判斷的時候使用這些描述信息。”一些研究顯示,採用一些問題來評估人們對基礎比率的使用情況,人們解決這些問題時所用的信息和使用的啟發法種類,受到他們對實驗者交談意圖的假設的影響(Krosnick,Li,& Lehhman,1990;Schwarz,1994)。

Krosnick等人(1990)注意到,那些證明人們不能充分利用基礎比率信息的研究,都是先給出基礎比率,再給出對個體的描述。如果參與者假設實驗者試圖讓信息與隨後的判斷相關和有意義,他們就會認為實驗者提供的個人描述是建立在基礎比率信息上(其信息本身的含義清晰,並對判斷有意義),因為他們認為這些描述尤其具有相關性和重要性。而且,正如人們通常所想的一樣,參與者假設說話者最後才會說出最重要的信息,他們就會特別關注最後說出的信息。