讀古今文學網 > 社會認知:洞悉人心的科學 > 第4章 假設檢驗、共變關係檢測和反事實思維 >

第4章 假設檢驗、共變關係檢測和反事實思維

本章將討論有關我們理解和體驗社會世界的方式中至關重要的幾個判斷任務。我們的很多社會知識都是在檢驗關於社會世界的假設過程中積累起來的,例如,這是個值得信賴的人嗎?我會喜歡這個社會活動嗎?我是否受到了公平的對待?我們也通過評估屬性與事件的共變關係來獲取知識,例如,圖書館管理員是不是特別害羞?兒童吃完糖果後,會不會變得多動?在本章中,我回顧了一些表明人們進行推理任務的能力是有限的證據。在對自己和他人的屬性作出結論時,我們所使用的檢驗假設和評估共變關係的策略會產生系統偏差,使我們發現事實上並不存在的共變關係,阻礙我們發現真實的共變關係。我也會討論使假設檢驗和共變關係的評估產生偏差,以及影響其準確性的一些因素。我還會解釋為什麼人們對社會事件的判斷這麼容易出錯。

我們理解和體驗事件的方式,不僅受到我們對已發生事件信念的影響,還會受到我們對將來可能發生的事件的預期的影響。有時,我們可能會為了使事情的結果變得更好而苦惱,例如“若是……,那該多好啊!”。有時,我們會感到非常的幸運,因為事情沒有變得像想像的那麼糟。我還會綜述在不同情境下我們持有的、讓我們產生反事實想法的一些原則,同時揭示它們會影響我們對事件的評估和對事件的情緒反應。

假設檢驗

回想一個你熟悉的單身女士。假定我的朋友弗蘭克想找一個女朋友。他喜歡性格外向的、友善的、容易相處的和大方的女士。你認為他會喜歡你的朋友嗎?她的性格外向嗎?

你會怎樣回答這個問題?當你想判定她是不是性格外向時,你想到了哪些關於她的信息?一種策略是提取有關她的所有信息,回憶所有可能表明她性格外向的證據,如友善的行為、與陌生人講話等等;同時回憶所有可能表明她性格不外向的證據,如害羞、迴避社會交往等等。綜合這些信息,你能夠對她的性格是否外向做出客觀的評價。但是,事實上我們通常不會平衡地搜尋兩方面的證據,而是傾向於收集某一方面的證據。在判斷自己的朋友是否性格外向時,大多數人只會尋找她外向表現方面的證據來判斷她是否性格外向,而不會同樣努力地尋找她性格內向方面的證據,證明她是內向性格的人。

證實策略

Klayman 和 Ha(1987)將這種片面的假設檢驗的方法稱為證實策略(positioetest strategy)。當你採用這種策略時,你會通過尋找與假設相符的事例來檢驗假設。當判定你的朋友是否性格外向時,你會尋找她性格外向的證據。如果你能找到這種證據,你就得出假設被證實(她確實是性格外向)的結論。如果你找不到這種證據,你會得出假設不成立的結論。當證據非常清楚時,這種策略是非常有效的。舉例來說,如果你朋友的行為表現一貫外向或一貫內向,那麼片面搜索證據也無關緊要,因為更平衡的搜索也將得出相同的結果。但是,如果相關的證據是混雜不清的,證實策略則可能誤導你的評估。例如,你的朋友在某些場合表現得外向,在其他場合卻比較害羞,僅僅查找她性格外向的行為事例,會使你誤判她比實際情況更加外向。在這種情況下,證實策略會誤導你,讓你的假設得到證實。

人們評估自己的假設時,無論是從記憶中搜索已經存在的知識,還是從外部世界搜索與假設相關的新證據時,都是採用證實策略來驗證假設。證實策略在社會領域裡的應用,特別容易導致假設得到證實的錯誤,原因有兩個:一是人們的社會行為在不同的情境下是不同的,二是我們關於他人的信息是混雜的,可以同時支持兩個對立的假設。

驗證關於他人的假設

有偏記憶的搜索 面對我們熟悉的人,我們常常會產生新的疑問:我的熟人會是一個好的室友嗎?我的孩子在附近的學校裡能夠健康成長嗎?我的兄弟會成為優秀的律師嗎?Marke Snyder和Nancy Cantor(1979)著手研究人們在檢驗針對熟人的假設時,是否會採用片面的搜索策略——在記憶中尋找信息,即搜尋那些符合假設的記憶信息。為此,他們首先給被試提供一些關於簡的混雜信息。被試閱讀簡一個星期內的生活概況,其中描述她在某些場合表現出外向性格,而在另外一些場合表現得性格內向。例如,她在博士的辦公室裡與人熱情交談,而在工作休息的時間裡卻不願意與別人一起聊天;她在慢跑時和陌生人交談,而在超市裡卻表現得很害羞。兩天後,被試回到實驗室,要求被試完成假設檢驗的任務:要求一半被試判定簡是否適合做房地產經紀人(儘管指導語中沒有明確的說明,但人們一般認為從事此項工作的人需要具備典型的外向性格);要求另一半被試判定簡是否適合做圖書管理員(一般認為從事此項工作的人需要具備內向性格)。

實驗要求被試認為簡適合做房地產經紀人或圖書館管理員時列出相關的事實證據。從表4.1上兩行可以看出,被試確實採用了證實策略,那些認為簡適合做房地產經紀人的被試,提取簡性格中外向的事實證據(4.03)多於性格內向的事實證據(1.28);而那些認為簡適合從事圖書管理員工作的被試,提取她內向性格的事實證據(2.56)多於外向性格的事實證據(1.00)。這種情況就好像被試問自己“我知道簡的哪些特點適合做這份工作?”而不是問“我知道簡的哪些特點與此是不一致的?”。

更為重要的是,有偏向性地提取有關簡的一些事實證據必然導致假設得到驗證的結果。如表4.1下面兩行數據顯示,那些要求檢驗簡是否適合從事房地產經紀人這份工作的被試認為,相比圖書管理員,她更適合成為一名房地產經紀人。與此相反,那些要求檢驗簡是否適合從事圖書管理員工作的被試認為,相比房地產經紀人,她將更適合成為一名圖書管理員。當我們手頭上有關於一個人的混合信息,而又熱衷於關於此人的片面假設,必然導致我們對自己的假設更有信心。

表4.1 被試回憶有關簡性格外向、內向的事實數以及對她從事兩種工作適宜性的評價分數

資料來源:Snyder & Cantor (1979,表2,p.338). Copyright 1979) by Academic Press. Reprinted with permission.

有偏證據的搜索 我們經常對剛剛認識的、不熟悉的人進行片面假設檢驗。這可能是源於先前的預期(艾略特的老師說他很聰明,真是這樣嗎?)、刻板印象(律師一般都是好鬥的,這個律師好鬥嗎?),或者我們的目標(我想僱傭一個熱情、細心的保姆,我正在面試的這個人熱情、細心嗎?),當我們為評估關於他人的這類假設而搜集我們需要的證據時,我們會依賴證實策略,因為人們的行為在任何一個人格維度上都很少一致,通常會導致假設得到證實的錯誤。Mark Snyder和William Swann等人的一系列研究表明,這種偏差確實存在。

在一項研究中,研究者要求被試評估等候在另一個房間內的陌生人的人格特徵(Snyder & Swann,1978)。發給其中一半被試一份典型的外向性格特徵清單,其中包括開朗、有信心和熱情等特徵,要求他們判斷那個陌生人的行為和經歷是否符合外向性格特徵。發給另一半被試一份典型的內向性格特徵清單,其中包括害羞、文靜和退避等特徵,要求他們判斷那個陌生人的行為和經歷是否符合內向性格特徵。然後,發給每個被試一張包含26個問題的表格,要求他們從中選擇12個問題提問,以確定此人是否具備某種性格特徵。備選問題清單中包括兩種片面問題:11個問題旨在詢問某人的性格是否外向的一些行為事例(例如,“如果你想活躍聚會的氣氛,你會怎麼做?”“如果你想認識一些新朋友,你會選擇哪些場合?”);11個問題旨在詢問某人的性格是否內向的一些行為事例(例如,“你希望自己在哪些場合下可以更加開朗?”“有哪些原因使你難以向別人敞開心扉?”),剩下的4個問題是中性的問題(例如,“你的職業目標是什麼?”)。

被試喜歡選擇那些與他們要檢驗的假設相符的問題。當被試想評估此人的性格是否外向時,選擇的評估性格外向的問題比評估性格內向的問題多;而當想評估此人是否內向時,與前面所述的選擇恰恰相反,他們選擇評估性格內向的問題多於評估性格外向的問題。簡而言之,被試對問題的選擇偏好,反映出他們採用了證實策略。

如果向別人提出這些有偏向性的問題,結果會如何呢?Snyder和Swann推論,如果提出的問題中大部分是評估性格外向的問題,將會給回答者很多的機會展現其性格外向的一面,卻留下很少的機會讓其表現性格內向的另一面。結果,回答者可能傳達了一個性格外向的自我形象。同樣地,如果那些提出的問題中大部分是評估性格內向的問題,回答者會表現得更加內向。這些推論得到了後續研究的證實,後續研究與初始研究的方法相同,唯一不同的是問題選擇之後,將這些問題向另一名被試(回答者)提問,研究者對提問過程進行錄音,只保留回答者的回答(磁帶中的問題被剔除)。對此項研究一無所知的一組評判者聽這些磁帶,評定每個回答者的性格外向性等級(Snyder & Swann,1978)。

與初始研究結果一致,被試偏好那些和他們要檢驗的假設相符的問題。此外,這些片面問題限定了回答者向別人傳達的印象。與那些要評估其性格是否內向的評價者相比,那些要評估其性格是否外向的評價者,提出了更多檢驗性格外向的問題,使回答者表現得更為性格外向。即便是另外的一些評判者,在沒有聽到回答者被問的問題,只聽到回答者的回答時,對回答者性格的評定也是外向。可見,評價者採用證實策略時,他們收集片面的證據,進而證實他們的假設。推而廣之,當我嘗試判斷你是否開朗、害羞、自信時,我採用的證實策略能夠限制你的反應方式,從而有利於證實我對你的假設。

上述結論受到了Trope和Bassok(1982,1983)的質疑,他們指出在Synder和Swann的研究中,被試沒有機會提問那些可以真正揭示某人性格是否外向的診斷性問題。他們認為,當某人被提問時,例如,“如果你想活躍聚會的氣氛,你會怎麼做?”。他實際上是被迫像性格外向的人那樣做出反應,他展示內向的唯一方法是否定該問題的假定(我並不經常活躍聚會的氣氛),然而出於禮貌,否定別人提出的問題是非常困難的。因此,這樣的問題不能真正區分性格外向和性格內向。Trope和Bassok認為,如果讓人有機會問那些診斷性問題,人們可能採用診斷性策略,也就是說,不管他們的假設是否成立,他們都會選擇最具有區分度的診斷性問題。

在一項檢驗這種看法的研究中,Trope和Bassok(1983)重複了Snyder 和Swann最初的研究,但他們使用診斷性問題代替原來的問題(例如,“你喜歡熱鬧的聚會嗎?”“你因為害羞而迴避社會交往嗎?”)。他們操縱了問題的診斷度,一些問題對性格內向或性格外向有很好的診斷度,例如前面列舉的兩個問題,也有一些問題的診斷度較差(例如,“你說話的聲音大嗎?”)。研究結果表明,被試十分依賴診斷性策略:比起低診斷度的問題,被試更喜歡高診斷度的問題;而且,診斷度的大小是被試選擇問題的最重要的決定因素。被試寧願選擇不符合他們假設的高診斷度問題,也不選低診斷度的、符合他們假設的問題。例如,被試檢驗某人的性格是否外向時,喜歡選擇“你因為害羞而迴避社會交際嗎?”這種具有高診斷度但不符合他們假設的問題;而不太喜歡“你說話的聲音大嗎?”這種低診斷度、符合他們假設的問題。

但是,被試在採用診斷性策略的同時,也採用證實策略:他們喜歡問與他們的假設相符的問題。其他研究也發現,被試更加偏愛診斷性問題,在一定程度上也喜歡與其假設相符的問題(Devine,Hirt,& Gehrke,1990;Skov & Sherman,1986;Trope & Bassok,1982)。如果要求被試在兩個具有同等診斷度的診斷性問題之間進行選擇,一個問題符合他們的假設,另外一個問題不符合他們的假設;此時問題的診斷性就不起作用,被試依靠證實策略。例如,當要求被試判斷某人的性格是否外向時,他們更喜歡問那些“外向性問題”,而不是具有同等診斷度的“內向性問題”(Devine,Hirt,& Gherke,1990)。當允許被試自己構建問題時,他們同樣運用證實策略:他們傾向於問別人一些符合他們假設的性格特徵的問題;而不問那些與他們假設相反的性格特徵的問題。被問者傾向於肯定地回答這些片面問題(可能由於他們自己也採用證實策略來構建答案),結果導致假設得到證實(Zuckerman et al.,1995)。

可見,我們不是因為依賴證實策略,從而忽略問題的診斷度這個重要信息;我們的確嘗試提出各種可能的重要問題。然而,在我們收集證據來檢驗假設時,我們依賴證實策略,這將會導致我們的判斷偏差。關於我們“自我”的判斷,甚至也會受到證實策略的影響,接下來我們討論這個問題。

驗證關於自己的假設

你自信嗎?友善嗎?快樂嗎?你贊成減稅嗎?提高學費呢?福利改革呢?你覺得你會喜歡獨木舟漂流嗎?參加高中同學聚會呢?聽哲學講座呢?日常生活中,我們經常需要回答這類關於我們自身的問題。有時,我們可能已經有了一個預先存儲的大致的答案(非常自信可能是你的“自我意象”的核心)。但是,通常我們需要根據我們的行為、想法和感受馬上構建答案。在這些情況下,如果我們依靠證實策略,我們就會選擇性地搜索與問題相符的信息,來回答那些片面問題。當我問你是否自信時,你從頭腦中提取的可能是關於你自信的證據;而當我問你是否不自信時,你從頭腦中提取的可能是關於你缺乏自信的證據。這種對自我知識的片面搜索可能影響一個人的自我觀念;由於受可得性啟發法的影響,剛剛回憶過自己自信事件的人們,可能認為他們比實際上的自我更加自信。因此,與被問及是否“不自信”的人們相比,被問及是否“自信”的人們,認為自己更加自信。

為了確定自我觀念是否只是簡單地受到片面問題影響,Kunda及其同事向學生提出了一些問題(Kunda et al.,1993)。在一項研究中,一半被試回答“你的生活是否快樂”這個問題,要求被試寫出他們腦海裡出現的過去的想法、情感和行為。另一半被試回答“你的生活是否不快樂”,也要求被試將他們想到的過去的想法、情感和行為寫出來。被試回答問題時,採用的是證實策略:與那些被問及是否“不快樂”的被試相比,那些被問及是否“快樂”的被試寫出了更多的快樂的想法和更少的不快樂的想法。而且,這一策略導致假設得到證實:與那些被問及是否“不快樂”的被試相比,那些被問及是否“快樂”的被試,認為自己的生活更加快樂。那些被問及是否“快樂”的被試中,有4%的人認為自己不快樂(即在評定量表中給出中等以下的消極評定);而那些被問及是否“不快樂”的被試中,有19%的人認為自己不快樂。

後續研究結果表明,只有在關於自我的“知識庫”是混雜的,可以同時支持兩個相互對立的假設的情況下,關於自我的片面問題才會導致假設得到證實。當人們的知識庫相當一致時,例如,問題是針對自我的相當一致的某個方面,或個體的社會行為相當一致,假設證實的偏差就得以消除。在這些情況下,片面問題如何提問對自我觀念沒有影響(Kunda et al.,1993)。片面問題引起自我觀念的偏差,是由於在不一致的自我記憶信息和信念中片面檢索信息造成的。

這些研究的發現,對於我們如何設計調查研究、解釋研究結果都有非常重要的意義。當你看到一個採用片面問題進行的調查,例如,“你支持某項政策嗎”,你應該意識到,這個調查很可能高估了這項政策的公眾支持率。相反的問題“你反對某項政策嗎”,很可能低估了同一政策的支持率。

人們也應該意識到,在對自己的態度、信念和特質進行評定時,可能也受到自己或他人所提出的片面問題的影響。在選擇自己的某種偏好之前,最好問問自己,我是否也有相反的偏好。像這樣考慮相反情形的假設,可以更加平衡地搜索相關的信念,從而做出更能代表自己真實態度的選擇(Lord,Lepper,& Preston,1984)。

選擇與否決

假設你在陪審團工作,陪審團的任務是審理一宗複雜的離婚案件。你需要判定孩子的監護權歸父母雙方的哪一方所有。你可能會問自己兩個問題,父母雙方中的哪一方應該獲得監護權?哪一方不能獲得監護權?有人可能認為這兩個問題是一樣的,畢竟,當你把監護權判給了某一方,同時你必須否決另一方的撫養請求。然而,問題的方向會影響你的審判結果。Eldar Shafir推測,當父母雙方中某一方的某些方面優於另一方,而在其他方面不如另一方的時候,問題的方向會影響判決的結果。例如,下面這對父母(Shafir,1993,p.549):

父母中的一方(A):中等的收入水平

中等的健康水平

中等的工作時間

與孩子的關係較好

社會生活相對穩定

父母中的另一方(B):較高收入水平

與孩子的關係非常密切

社會生活極其活躍

經常出差

有點健康問題

在上述情況下,有很多理由將孩子的監護權判給B:B的收入比A高;與孩子的關係也比A要密切。但是,也有一些理由認為B不適合做監護人:B經常出差,而且有些健康問題。

如果你採用證實策略來做出判定,那麼,當你問“誰應該獲得監護權”時,我們將主要關注那些讓父母雙方中的一方優於另一方的信息。B在多個方面優於A,因此我們應該將監護權判給B。但是,當你問“誰不應該獲得監護權”時,我們將主要關注那些讓父母雙方中的一方比另一方差的信息。B在多個方面比A差,因此不能將監護權判給B。這在Shafir的研究中得到證實,被問“誰應該獲得監護權”的被試,多數選擇B;被問“誰不應該獲得監護權”的被試,多數選擇B!

Shafir的這項研究和其他類似的研究都表明,當我們在選擇勝利者時(“誰應該獲得獎金?”、“誰應該被研究生院錄取?”、“誰應該當選為政府官員?”),我們喜歡選擇那些複雜的、有明顯的優點和弱點的人,而不是沒有明顯優點與缺點的普通人;因為我們有更多的理由選擇那些優點與缺點都明顯的複雜人物。但是,當我們淘汰失敗者時(“從獲獎候選人名單中刪除誰?”、“研究生院拒絕錄取誰?”、“從政府官員候選人名單中淘汰誰?”),我們喜歡淘汰那些有明顯的優點和弱點的複雜人,而不是優點與缺點都不明顯的普通人;因為我們有更多的理由否決那些複雜的人。一個選擇委員會通過選擇最佳的候選人而得出的候選人名單,與另一個選擇委員會通過否決最差的候選人而得出的候選人名單,有很大的差異。

申請者和入選人數的比例,部分地決定了人們採用哪種策略。如果我們的任務是選擇很少的申請者,錄取比例非常低(如,100個申請者競爭1或2個職位),我們注意的焦點是發現申請者的弱點和拒絕他們的理由。但是,如果我們的任務是選擇與錄用很多申請者,錄取比例非常高(如,100個申請者競爭50個職位),我們注意的焦點不再是拒絕申請者的理由,而是發現申請者的長處和選擇他們的理由(Ross & Ellard,1986)。結果,在只提供少數職位這種激烈競爭的情境中,我們傾向於低估申請者的能力;而在一個競爭不太激烈的情境中,對申請人能力的評價會偏高。

與陌生人相比,對於我們非常熟悉的人,我們的認識更加複雜和詳細。因此,與陌生人相比,我們有更多的理由選擇熟人,也有更多的理由否決熟人。這也許可以解釋,為什麼在某些場合,我的兒子讚美我是世界上最好的媽媽;而在不快樂的情境下,他譴責我是世界上最壞的媽媽……

預言的原因分析

回想一個你剛認識不久、不太熟悉的人。在未來的幾個月裡,你覺得你至少會和他一起去看一次電影嗎?或者,你會繞道而行,避開他嗎?在回答這些問題之前,先花點時間思考你這樣做或不這樣做的原因?有人可能認為,思考會與他一起去看電影的原因,可以增加自己預言的準確性。實際上結論是否定的。

當分析預言的原因時,人們可能依靠證實策略,從而將注意集中在做出這種行為的理由上。即便你不是特別喜歡那個人,你也會想出一些和他一起去看電影的理由。結果,你會認為你確實有理由同他一起看電影。為了檢驗這些觀點,Wilson和LaFleur(1995)設計了一項研究,他們要求大學女生聯誼會的成員針對一個新認識的成員做出類似的預言,預測在下學期她們對待新成員的可能行為。同時,還要求其中一半的被試,在做出預言之前,列出這樣做或不這樣做的理由。該學期結束後,Wilson和LaFleur記錄了被試針對那個新成員的實際行為的報告。這可以幫助研究者分析被試預言的準確性。

要求被試分析他們預期行為的理由,使得他們高估了預期行為的可能性。這表明,採用證實策略,使他們傾向於思考做出這些行為的原因;而且,他們的預言基於這種有偏差的思考之上。然而,原因分析對他們的實際行為並沒有影響。因為原因分析只會增加我們對某種行為出現可能性的預期,而不會改變某種行為實際出現的可能性;所以,原因分析的結果實際上降低了預言的準確性。在以下兩種情況下,進行原因分析都會降低預言的準確性:一種情況是,沒有這樣的原因分析,人們能夠做出較為準確的預言;另一種情況是,人們已經高估了行為產生的可能性。當然,如果人們在開始時低估了行為出現的可能性,原因分析可以增加對行為出現概率的估計,從而提高預測的準確性。

我們通常認為仔細思考可以增加我們推理的準確性。上述研究的結論與我們的直覺相反,仔細思考有時弊大於利。當我們仔細思考問題,並且採用啟發法策略(如證實策略),仔細思考會增加“偏差”(參見Tetlock & Boettger,1989;參見第3章的相關討論)。

至此,我們已經討論了如何針對單一屬性進行的假設檢驗,如“簡性格內向嗎?”“我會和她一起去看電影嗎?”。接下來我們將探討,如何檢驗複雜的假設——涉及兩個相互聯繫或相關的變量的假設。

共變關係的檢測

電腦黑客缺乏人際交往技巧嗎?優秀的科學家會是優秀的老師嗎?在家裡不聽話的孩子,在學校也會調皮搗蛋嗎?你和你最好的朋友對電影的評價一致嗎?這些問題都涉及兩個變量的共變關係。在我們的日常生活中,經常需要分析類似的共變關係。為了理解我們的社會環境,我們必須確定團體成員與行為之間的共變關係、兩種情境下行為之間的共變關係、兩個人的觀點之間的共變關係等。由於我們很多的社會知識都是基於對這些共變關係的認識,因此確定共變關係的能力非常重要。在某些情境中,我們可以很準確地評估共變關係;但是在評估共變關係時,我們也會經常陷入困境,結果經常對社會環境形成誤解。

利用2×2表格評估共變關係

假設你想探討教授與心不在焉之間的聯繫或共變關係。教授是不是特別容易心不在焉?為了收集必需的信息,假設我漫步在大學校園裡,觀察行人,區分哪些是教授,哪些不是;同時記錄他們是否心不在焉。數據見表4.2。請你留心分析一下表中的數據,基於這些信息,是否可以認為教授特別地心不在焉嗎?

表4.2 假設的數據

怎樣來回答這個問題呢?為了判定教授與心不在焉之間是否有聯繫,我們必須知道心不在焉的教授與沒有心不在焉的教授的比例(600:400,也就是3:2),是否顯著地高於非教授的同一比例(300:200,也就是3:2)。然而,此例中兩者的比例相同,因此教授和心不在焉之間沒有關係。

然而,很多人沒有注意到表格中的4個單元格之間的數據是相關的。相反,人們傾向於只關注這些單元格的一兩個。很多人只關注“是—是”單元格的數據,即標定為A的單元格(在本例中代表心不在焉的教授人數;Smelsund,1963;Jenkins & Ward,1965)。仍以表4.2的假設數據為例,由於單元格A的人數最多,只關注單元格A的數據可能會受到誤導,使人們相信教授特別容易心不在焉。另一個經常採用的策略是,比較單元格A和單元格B(比較心不在焉教授的人數和沒有心不在焉教授的人數),由於心不在焉的教授人數比沒有心不在焉教授的人數多,因此,這個策略也會誤導人們,使其看到並不存在的共變關係,以為教授特別容易心不在焉。很少有人意識到表4.2中的4個單元格的數據是相關的(綜述參見Klayman & Ha,1987)。

人們只關注“是—是”單元格數據的這種傾向,可以看做人們採用證實策略的例子。當判定教授是否心不在焉時,我們搜集支持這一假設的事例,即心不在焉的教授。比較單元格A和單元格B的這種傾向,同樣可以看做採用證實策略的例子,我們搜集符合這一假設的案例——所有教授中出現心不在焉的人數(單元格A),或者沒有出現的人數(單元格B)(Klayman & Ha,1987)。

有些人爭辯說,占星術真的很靈,這就是我經常遇到的發現錯誤的共變關係的事例。迷信占星術的人們經常以少數幾例“星位”準確預測了事件,從而相信占星術。這種只關注單元格A中數值的做法不夠好。要準確確定這種共變關係,還需要知道占星術預言將會發生、但沒有發生的事件的數量(單元格B),即便這樣還不夠。還需要知道星位沒有預言但發生了的事件的數量(單元格C),以及星位沒有預言過,也從未發生過的事件的數量(單元格D)(Nisbett & Ross,1980)。

相較而言,通過列聯表評定共變關係要簡單得多,而通過在幾個月的時間裡遇到的教授與其他人群是否心不在焉,來評價教授是否特別心不在焉,這要難得多。而將數據整理到2×2表格中,可以避免根據很長一段時間內發生的許多事件評定共變關係,避免受到錯誤記憶和錯誤編碼的干擾。在這種相對簡單的任務中我們尚且遇到困難,這對於我們在更加複雜的自然觀察中探討共變關係不是個好兆頭。人們或許會說,他們對2×2表格數據的推理沒有經驗,他們在其他熟悉的推理任務中會表現得很好。其實,情況並非如此。像接下來要討論的一樣,人們對更自然的共變關係的探測同樣會遇到困難。結果是,我們通常會發現實際上並不存在的相關關係,卻不能發現實際存在的相關關係。

虛假相關

很多醫生和患者都相信,關節疼痛受天氣狀況的影響。然而科學研究卻沒有發現它們之間的聯繫。Redelmeier和Tversky(1996)認為是錯誤的共變關係探測導致人們產生這種觀念,人們可能看到事實上並不存在的“虛假相關”(illusory correlation)。為了檢驗這種可能性,他們在15個月內,跟蹤研究18位關節炎患者,每月兩次記錄病人和醫生報告的疼痛和不適感的程度,同時記錄對應時間段當地的天氣情況,包括大氣壓力、氣溫和濕度。幾乎所有的病人都深信關節疼痛程度和天氣狀況高度相關。然而,當研究者將病人報告的疼痛程度和當時的天氣情況進行相關分析時,並沒有發現顯著的相關,平均相關值趨近於零。

證實策略可能導致了這種虛假相關。如果我們的先入之見使我們期待某種相關關係的出現,那麼我們會特別注意那些反映這種相關關係的事例。關節炎患者會特別注意伴有關節疼痛加劇的天氣變化,不太注意那些關節疼痛加劇而天氣沒有變化或者天氣變化而關節疼痛沒有加劇的事例。結果,當關節炎患者評定天氣變化和關節疼痛程度之間的相關關係時,那些證實這種相關關係存在的事例較多且容易提取,這就對相關關係的估計造成不利影響。

在Loren Chapman和Jean Chapman(1967,1969)的一系列研究中,對於因先入之見和期望而導致人們看到實際數據中並不存在的虛假相關的情況做了更嚴密的檢驗。他們著手研究的問題是,儘管很多研究結果表明投射測驗不能有效地測量人格特徵,為什麼臨床心理學家繼續使用和相信投射測驗(例如,畫人測驗)。Chapman和Chapman認為,可能是臨床醫生使用投射測驗的經驗,使他們“看到”了病人對於測驗的反應和病人的症狀之間的虛假相關。他們的研究證實,這種虛假相關的知覺是由先前的期望引起的,即使數據分析結果證實這種相關關係並不存在,他們依然認為這種虛假相關的確存在。

一系列研究將注意投向非常流行的羅夏墨跡測驗,這種測驗向被試呈現一些由墨跡形成的圖案卡片,要求被試回答在每張卡片上看到了什麼?Chapman和Chapman針對這種測驗開展了一系列研究。他們研究人們如何評價同性戀與羅夏墨跡測驗的特定反應之間的相關關係。這是一個非常有趣的研究課題,因為先前的羅夏墨跡測驗研究發現兩個經過證實是可靠的但是與直覺相反的相關關係:同性戀比異性戀更容易在某一張卡片上看到恐怖的怪物,也更容易在另外一張卡片上看到似人又似動物的雙觀圖。同時,很多憑直覺看來兩者應該有相關關係,實際上兩者之間並不存在相關關係。與直覺相反,同性戀者與異性戀者相比,他們並沒有更多地看到與肛門、女性衣服有關的內容,或者看到不男不女的人。

Chapman和Chapman首先研究發現,臨床醫生關於投射測驗的經驗,使他們對這種基於高度直覺卻不穩定的相關深信不疑。他們的研究也發現,缺乏有關經驗的學生也持有同樣的觀念,因此,臨床醫生的這些觀念可能是根植於廣泛的、文化的假設,而不是基於其單純的臨床經驗。Chapman和Chapman開始研究人們是否在一系列數據中“看到”事實上並不存在,但是在直覺上卻非常吸引人的相關關係。為此,他們向被試呈現一組羅夏墨跡測驗卡片,每張卡片同時附有某人對該卡片的反應,以及描述他本人特徵的兩句話。對卡片的反應中,某些反應表現出真實可靠卻與直覺相反的同性戀特徵(例如,一個雙臂縮短的巨人);某些反應表現出與直覺相符卻並不真實可靠的同性戀特徵(例如,一件有花邊的女式緊身內衣);某些反應是中性的(例如,一張西班牙地圖)。對個人特徵的描述中,某些個人特徵的描述與這些反應相關,表明此人是同性戀;某些描述則沒有涉及性取向。構建這些數據的時候,反應類型和個人特徵描述類型之間沒有相關關係(自述為同性戀的人對卡片的反應,與其他人的反應沒有差別)。

向被試逐張快速呈現卡片,要求他們評估反應類型和個人性格描述之間的關係。被試報告發現,某些在直覺上很像是同性戀者的反應與同性戀之間有相關,但是,事實上對觀測的數據分析並沒有發現這種相關關係。在後續研究中,研究者故意安排這種直覺反應和同性戀傾向之間呈負相關;這就是說,人們認為同性戀者應該與某些反應相聯繫,實際上,異性戀者做出這類反應比同性戀者還多。即使實驗這樣安排,也沒有降低虛假相關的數值。被試認為同性戀和某種特定反應之間應該存在相關關係的先入之見,導致他們發現觀察的數據中存在這種相關,實際上,數據中並沒有這種相關。更為嚴重的是,兩者之間實際上是負相關關係,而他們卻發現了正相關關係。

以上研究結果警示我們,任何基於個人經驗,而非科學調查得出的相關關係都是值得懷疑的。就像臨床醫生和學生可以發現測驗反應與診斷之間並不存在的相關關係一樣,管理者可能發現員工的種族或性別與工作表現之間並不存在的相關關係;丈夫可能發現妻子的情緒與生理週期之間並不存在的相關關係;家長和老師可能發現兒童糖類攝入量與問題行為之間並不存在的相關關係;大學生可能發現夥伴的專業與其個性之間並不存在的相關關係。我們從過去的經驗習得的許多知識經驗,與其說是對客觀現實的反映,不如說是反映了我們關於這些客觀現實的先入之見。某些虛假相關導致的不良後果可能不太嚴重,但是某些虛假的相關,可能導致不公平的社會政策出台,或者導致個人做出一些不恰當的決定。

通過虛假相關所形成的刻板印象

媒體報道的超級明星很少,非洲裔美國人也相對較少。像比爾·科斯比(美國著名喜劇演員——譯者注)或奧普拉·溫弗瑞(美國“脫口秀女王”——譯者注)這樣的非洲裔美國超級明星更是屈指可數。David Hamilton等人認為我們可能會額外注意那些稀少的、特別的人物。因此,與白人明星相比,黑人明星的可記憶性程度更高,而且在評定種族和明星之間的關係時,人們更容易想到黑人明星。因此,我們可能會認為美國黑人更容易成為媒體的超級明星,事實上,黑人超級明星在黑人中所佔的比例與白人超級明星在白人中所佔的比例沒有差異。換句話說,我們“看到”了一個虛假的相關。

更一般地說,我們容易高估人群中屬於少數群體成員身上發生的罕見行為的頻率。當某個群體和某種行為都罕見時,它們共同出現(例如,群體中的一個成員出現了這種行為)的情況更為罕見。這種特別的群體更易被發現且更易被記住,因此,導致群體成員與那種行為之間產生虛假相關。

為了檢驗這種想法,Hamilton和Gifford(1976)把被試分成兩個組,其中一個組是大組,叫A組;另一個組是小組,叫B組。被試依次閱讀39個人的信息,這些信息包括個體所屬組別和此人的所作所為(例如,布魯斯,B組成員,為了成為政治候選人做過義工;喬,A組成員,他喜歡對別人冷嘲熱諷,這一點讓人非常不舒服)。A組的人數是B組人數的兩倍;積極行為出現的頻率是消極行為出現頻率的兩倍多。組別和行為的積極性之間不存在相關關係,兩組的積極行為和消極行為的比例相同。儘管實際上沒有相關關係,研究者還是預測被試會發現虛假的相關。B組的成員少,他們所做的消極行為也少,因此消極行為是少見的、特別的行為,所以研究人員預期這種少見的行為更易被記住,最終讓被試形成對B組成員的不良印象。

研究結果證實了這一假設:被試發現了組別和行為積極性之間的虛假相關,而且高估了B組(人數較少組)成員做出罕見消極行為的頻率(相反,他們對A組的消極行為的估計相對準確)。最終的結果是,他們認為B組比A組更加消極。換句話說,被試對B組成員形成了實驗數據並不支持的相對負面的刻板印象。

後續的研究用相同的範式,證明了這種虛假相關的確是由於稀少的、特別的個體吸引了人們的注意力,讓人難以忘記(參見Hamilton & Sherman,1994)。一項研究提供了極好的證據。在這項研究中,被試花很多時間分析與檢查那些描述特別事件的句子,即描述少數群體成員所做的罕見行為的句子,而在其他類型句子上所花的時間都不長。這表明他們特別關注那些特別的事件。此外,對特殊個體組和普通個體組的不同關注程度,影響到每組中出現不同類型行為的頻率的估計,從而影響到對各組的喜愛程度(Stroessner,Hamilton,& Mackie,1992;不同的情緒狀態導致不同的結果,這與當前探討的問題聯繫不大)。人們對發生的特別事件容易額外注意,也會影響該事件的可記憶性。在另外一項研究中,被試記住特別行為的比例明顯高於其他行為(Hamilton,Dugan,& Trolier,1985)。我們特別關注少數群體表現出的罕見行為,並且容易記住它們;這種現象可以解釋我們為什麼認為少數群體更多地表現出罕見的行為。

考慮一下對少數群體刻板印象的研究的意義。消極行為出現的頻率相對較低,少數群體成員做出這種罕見的消極行為將會特別引人注目、令人難忘。因此,該群體常常被誤認為特別容易做出消極行為,儘管事實上不是這樣。Hamilton及其同事的研究表明,即使不存在預先的期望,由於人們對少數群體所做的罕見行為特別關注,因此容易對少數群體形成消極的刻板印象。而預先存在的消極期望,理所當然會加劇這一現象。例如,如果我們認為某個少數群體特別容易做出犯罪行為,我們會特別注意這一群體中的罪犯,這不只是因為他們很特別,還因為他們可以證實我們的假設。結果,我們可能為我們的消極刻板印象找到實際不存在的支持。

以上我們集中探討了消極刻板印象,因為它們尤其令人煩惱不堪。請注意,同樣的過程也可以形成沒有根據的積極刻板印象。罕見的積極行為就像罕見的消極行為一樣,對我們的判斷也能產生不當的影響(Hamilton & Gifford,1976)。

沒有檢測到實際上存在的相關

事先的期望和先入之見會導致人們發現實際上並不存在的虛假相關(Crocker,1981;Nisbett & Ross,1980)。但是,缺乏先入之見時,人們有時不能發現意料之外的、卻真實存在的相關關係。Loren Chapman和Jean Chapman(1969)構建了一組數據,使同性戀傾向與一些違反直覺但確實能表明同性戀傾向的某些跡象之間存在相關關係。結果驗證了上述觀點,被試沒能發現這種意料之外的相關關係。Jennings、 Amabile和Ross(1982)的研究也得出了類似的結果。他們構建了幾組數據,代表兩組變量之間客觀存在的不同的相關關係,每組數據包含10次觀察(例如,10個不同身高的男人拿著不同長度的枴杖;10組配對的數據)。要求被試仔細分析每組觀察數據之後,判斷這兩個變量之間關係的強度(例如,男人身高和枴杖的長度)。由於研究中的變量都是任意選取的,被試不可能具備變量之間有相關關係的先入為主的概念,因此本研究可以檢驗人們在簡單的數據組中探測“意外”相關關係的能力。

被試能夠發現非常強的相關關係(r = 0.80及以上),他們估計的相關值也很高。但是,他們將比較強的相關(r = 0.70)估計為中度相關,而且經常不能發現中度相關(r = 0.20~0.40),對中度相關的估計值趨近於0。正如Jennings等人指出的那樣,我們所處的社會環境中,很多重要的、真實事件之間的相關程度為中度相關或者低度相關。例如,人格特質和行為的相關值很少超過中度相關水平(Mischel,1968)。人們從簡單而且單純的數據中都無法發現中度相關,可以推論,人們也無法發現現實生活中那些意料之外的相關關係。

共變關係檢測的準確性

儘管前文論述了我們在評定共變關係時所遇到的困難,但我們仍然有能力對某些日常相關關係做出相當準確的評定。在討論人們的統計推理時,我談到人們在自己熟悉的領域裡,對易於編碼的事件採用的是統計推理的方法(Nisbett et al.,1983;參見第3章)。熟悉的領域、易於編碼的事件同樣有助於對共變關係的探測,Richard Nisbett和我的一系列研究發現,當數據很好編碼,而我們對這些數據又非常熟悉時,我們對相關關係的估計十分準確(Kunda & Nisbett,1986)。

有幾項研究將人們在幾個熟悉度和可編碼程度不同的領域中對相關的估計與這些領域的實際相關進行比較。第一項研究考察熟悉度不同時,人們進行評估時的一致性程度。這些評估易於編碼,例如,簡告訴我說,她喜歡湯姆,對像明確(一個人的評價);這個評價非常容易計分,也容易與我對湯姆的評價進行比較。研究者假設,在這種易於編碼的領域中,對該領域的熟悉度越高,人們對共變關係的評估也越準確。

人們在熟悉的領域中評估共變關係的準確性非常高;我們對別人的人格特質的評定就屬於這樣一個熟悉的領域。人們花費很長的時間來討論別人,所以在評價別人的人格特質時,人們彼此非常熟悉自己的觀點和別人的觀點在多大程度上一致。我們要求婦女聯誼會的成員相互評價彼此的一些人格特質,例如可愛、聰明、害羞等,然後計算任意兩個人在每種人格特質上的平均相關值。同時要求其他被試估計這些相關值的大小。

圖4.1描述了成員之間實際的一致性程度(用實線表示)和被試估計的一致性程度(用虛線表示)。從圖中可以看出,被試對易於編碼的、自己熟悉領域中的共變關係的評價是非常準確的。例如,在評價自己熟識的人是否健談時,與評價其是否可愛相比,人們的一致性程度更高。

圖 4.1 任意兩個個體之間人格特質的實際的和估計的一致性程度

資料來源:Kunda & Nisbett (1986,圖2,p.205). Copyright 1986) by Academic Press. Reprinted with permission.

大學生對心理學家資助哪些研究項目,以及學術期刊錄用哪些稿件的評估不夠準確,他們對這些領域不熟悉(即使是專業的心理學家對此也不是很熟悉,其評估的準確性也並不高)。總之,這些研究結果表明,人們對不熟悉的相關關係的評估可能不夠準確,而對非常熟悉的相關關係的評估可能比較準確。

然而,就像在第3章中討論的那樣,熟悉性這個因素只有在數據可以編碼的情況下才能起作用。一些熟悉的行為較難編碼,像學術水平和運動技能這些反映能力狀況的行為,都是我們非常熟悉的且易於編碼(編碼單位可能是一次測驗和一場比賽),而且容易計分;相反,有些熟悉的行為,例如社會行為,卻難以編碼。社會行為的構成單元比較複雜、模糊,社會行為本身也經常難以解讀。如果可編碼程度促進了相關關係評估的準確性,那麼人們對能力領域相關關係的估計比對人格特質領域相關關係的估計要準確得多。

在一項驗證以上假設的研究中,研究者要求被試評估人們在不同社會情境中行為的一致性。被評估的能力和人格特質各有兩種:拼寫能力和打籃球能力,誠實和友善(Kunda & Nisbett,1986)。換言之,他們需要評估兩種情境下人們行為之間的關係。參與者對於自己熟悉的、易於編碼的領域的判斷十分準確;但是對自己熟悉卻難以編碼的人格領域卻難以正確評估,他們大大高估了兩種社會情境下社會行為的一致性。這些研究表明,我們遠遠高估了人們行為的一致性。結果,我們經常會驚奇地發現,在某種社會情境下表現得非常友善、誠實或能力不足的人,卻在另一種社會情境中表現得非常不同。我們不能準確地探測社會領域中的相關關係,這方面的詳細內容將在第10章進行探討。

基於解釋的判斷

關於假設檢驗和共變探測的大多數研究都間接或直接地假定,我們是通過收集多個獨立的數據,例如,內向或外向行為的事例,群體成員中發生消極行為的事例等,通過將這些事例(數據)累加或平均,通過評估其相對頻率,或者應用這些事例的容易程度,得出我們的最終判斷。我們的很多判斷確實是按照這種方式進行的,但是也有很多判斷過程需要進行更加複雜的因果推理。這些判斷的實例包括:陪審員判定被告是否有罪,醫學專家評估一種新的疾病理論,外交專家評估中東地區和平穩定的可能性,以及你對自己目前浪漫愛情結果的估計。類似這些判斷都需要進行詳細的因果分析,而且需要我們運用各種不同的證據、它們的相互關係及其可能的結果等廣泛的社會知識或常識。在第2章討論概念時,我就提到過很多概念中都蘊涵著因果知識(Murphy & Medin,1985)。

陪審團判決的故事模型

試想一下著名的加州審判,名人O.J.辛普森被指控謀殺自己的前妻。你認為辛普森是否有罪?如果你一直關注審判的進展,並且對此案形成了自己的看法,你可能就不僅僅只通過比較那些證明他有罪的證據和證明他無罪的證據的數量,來判斷他是否有罪。你很可能在兩種理由之間做出選擇,或者說在不同的故事之間進行選擇,即選擇那個可以解釋和賦予所有相關證據意義的故事。一個故事是由起訴方提出的,認為辛普森有罪。這個故事包含以下信息:他有殺人動機,曾經虐待過妻子,有作案的時間,在他家後院發現沾有受害人鮮血的手套。另一個故事是由辯護方提出來的,認為辛普森是無辜的,作為一名黑人,他是被種族歧視的警察陷害的。這個故事包含以下信息:某名警察有種族歧視行為的記錄,警察機關是腐敗的、無能的,那雙沾有鮮血的手套與辛普森手掌大小不合。所有的證據在兩個故事中都有著不同的含義。例如,那雙沾血的手套可能是辛普森從犯罪現場回來掉在後院的,也可能是腐敗的警察有意放在後院的。追蹤審判過程的人們,需要判斷哪個故事能夠更好地解釋當前證據,他們對證據的理解和組織無疑會受到先前所贊同的故事的影響。Nancy Pennington和Reid Hastie開展了一系列卓有成效的研究,研究表明不同的故事模型對審判結果有重大影響(Pennington & Hastie,1986,1988,1992)。

在Nancy Pennington和Reid Hastie研究的第一階段,讓被試從陪審員的角度觀看一次審判的全過程,他們會自發構建關於審判案件的一個故事(Pennington & Hastie,1986)。要求被試口頭報告他們是如何做出判定的,而不要求被試列出那些不相關的證據。但是,被試詳細描述了他們認為發生了什麼。一個典型的故事包括事件發生的邏輯順序(例如,被告的女友要求被害人載她一程。被告非常生氣,一刀捅向被害人)。被試經常推斷其心理狀態(例如,被告非常嫉妒),這在審判過程中從來沒有直接提到過,但它有助於人們理解發生的事件;相反,他們常常不提那些審判中提到的證據,因為它們與自己構建的故事無關。做出不同判決的被試,他們構建的故事完全不同,事件的因果關係順序也不同(什麼導致了什麼,為什麼)。

這些最初的研究表明,陪審員通過構建故事理解證據的意義,最終做出判決。當然,被試也有可能是通過其他認知過程先做出判決,然後再構建故事,證明其判決是正確的。以下一系列實驗研究排除了這種可能性。Pennington和Hastie(1992)推測,如果可以操縱辯護故事和起訴故事的構建難易程度(基於同樣的證據),來影響人們的判決,這樣就可以說明人們的確是在構建故事的基礎上作出判決的。

所有被試閱讀關於謀殺案的同樣的審訊材料,但是這些證據的順序是不同的,使得構建辯護故事和起訴故事的難易程度不同。當有關證據是按照故事的順序,即按照因果和時間順序呈現時,故事構建起來比較容易。例如,先呈現謀殺發生之前的相關事件,然後呈現打鬥、殺死對方的證據,最後呈現逮捕和屍體解剖的證據。當證據的呈現按照混亂的順序,而不是按照事件的原始發生的順序呈現時,故事構建起來比較困難。例如,從打鬥的證據,到傷口的情況,再到打鬥發生前一天的相關事件。

所有的被試按照不同的順序閱讀同樣的證據材料。一種情況中,起訴的相關證據是按照“故事”順序呈現的,因此起訴故事比較容易構建;辯護的相關證據是按照混亂的順序呈現的,因此辯護故事的構建比較困難。另一種情況中,辯護的相關證據是按照“故事”順序呈現的;起訴的相關證據是按照混亂的順序呈現的。研究結果表明,證據呈現順序的操縱,對判決結果有顯著的影響。當起訴故事容易構建,而辯護故事難以構建時,78%的被試做出被告人有罪的判決。但是,當辯護故事容易構建,而起訴故事難以構建時,只有31%的被試做出了被告人有罪的判決。在另外兩種實驗條件下,兩種故事同樣容易構建,或者兩種故事同樣難以構建,結果是大約有一半的被試做出被告人有罪的判決。這一研究結果令人感到不安,僅僅改變證據呈現的順序,而不改變證據的內容,就會使被告人被判有罪的可能性增加到原來的兩倍以上。

很明顯,我們並非僅僅將獨立的證據累加在一起就可以做出判決;而是通過構建故事來做出判決,所以那些影響故事構建的因素都會影響我們的判決。

解釋的連貫性

故事模型的相關研究表明,當對事實有兩種不同的解釋時,我們會選擇能將所有證據更好地聯繫在一起的那個解釋,也就是,選擇能夠為所有相關證據提供連貫一致解釋的那個故事。但是,我們要如何確定哪種解釋具有最好的連貫性呢?科學哲學家Paul Thagard提出了解釋的連貫性理論,清楚地說明了決定解釋連貫性的原則(Thagard,1989)。

設想你要解釋你的女朋友利薩為什麼在吃晚餐的時候對你大喊大叫。你要在兩種假設中作出選擇,一種可能是利薩不再喜歡你了;另外一種可能是利薩那天工作不順心。這兩個假設都可以很好地解釋利薩對你做出的行為。但是相比之下你可能會更加傾向於其中的某個假設——可以很好地解釋其他關於利薩的信息。設想利薩非常疲憊,而且你聽到她在電話裡向她媽媽喊叫。利薩“工作不順心”的假設比利薩 “不再喜歡你”的假設能夠更好地解釋這兩種行為。利薩 “工作不順心”的假設解釋了更多的證據,似乎更加真實。一般而言,我們偏愛那些解釋範圍更廣的假設。如果你認為利薩對你大喊大叫是因為她不再喜歡你了,你可能仍要對“利薩非常疲憊”和“利薩曾在電話裡向她媽媽喊叫”做出額外的解釋。利薩 “工作不順心”假設可以直接解釋利薩所有相關的行為。一般來說,我們偏愛那些簡明的假設,只需要很少的額外假設就可以解釋所有事實。

現在假設你知道,由於利薩的幾個同事被解雇了,因此她最近幾周工作特別努力。這解釋了利薩工作不順心的假設,使這一假設更加真實可信。一般而言,我們偏愛那些能夠被其他信息解釋的假設。利薩工作不順心的假設變得更加真實可信的同時,她不再喜歡你的假設變得更加不可信。一般來說,我們是通過比較來評估幾個競爭性的假設,一種假設的可能性增加,另一種假設的可能性就會降低。

總之,我們對一種假設的信心會隨著假設的解釋範圍、簡明性,以及假設能為其他信息所解釋的程度的增加而升高。我們對一種假設更有信心的同時,對其他競爭假設的信心就會喪失。

Thagard(1989)編製了一個計算機程序,程序體現了這些以及另外幾個附加的解釋連貫性原則,並結合運用這些原則來評估幾個競爭假設的連貫性。這個程序成功模擬了一系列不同的判斷過程,從科學家對幾個競爭的科學理論的偏愛到陪審員對起訴或辯護故事的偏愛。研究發現計算機程序偏愛的解釋與科學家和陪審員偏愛的解釋一樣,這表明,該理論為人類判斷過程提供了一種可能的模型。

Steven Read 和 Amy Marcus-Newhall(1993)在上述研究基礎上,進一步發現人們同樣採用這些連貫性原則來解釋社會行為。Steven Read 和 Amy MarcusNewhall建構了一些包含個體許多事實的腳本,例如,他的行為、想法、願望和社會環境,要求被試評價為這些事實所提供的幾種解釋。在不同的研究中,幾個競爭性的解釋在以下方面有所不同:可以解釋的事實的數量、需要額外假設的數量和它們自身是否可以被解釋。研究結果表明,被試偏愛那些更有解釋力、更簡明以及自身能夠被解釋的解釋。此外,他們對競爭性假設的評估是具有比較性的:一種解釋連貫性的增加,會導致另外一種解釋可能性的降低。更重要的是,Thagard編製的計算機程序模擬了根據解釋連貫性做出判斷的過程,其結果與參與實驗的被試的選擇結果一樣。計算機對經驗結果的成功模擬支持這種想法,即計算機程序使用的那些解釋的連貫性原則,我們人類也一樣使用。

人們如何解釋社會行為,這個問題始終為社會心理學所關注。很多關于歸因的研究將研究重點放在人們如何在行為的兩個競爭解釋之間做出選擇的問題上,行為的產生是行為者潛在的人格因素造成的,還是環境因素造成的?(綜述參見Jones,1990,另外參見第9章)有關解釋連貫性方面的研究,為人們在不同情境下選擇哪種競爭的解釋提供了指導方針(Read & Miller,1993;Thagard,1989)。解釋連貫性的研究也提出了一些歷來為歸因學家所忽略的重要問題:我們如何在幾種競爭的人格特質解釋之間做出選擇(喬納森微笑是因為他很友善,還是因為他很世故);我們又如何在幾種競爭的情境性解釋之間做出選擇(埃莉的不良行為是由於壞朋友的影響,還是因為她的父母對她漠不關心)。

Pennington 和Hastie(1986)所做的研究,即陪審員的判決基於故事模型及其解釋的連貫性,有非常明顯的應用價值。連貫性原則可以幫助陪審員確定哪個故事看起來最可信。其他的研究表明,就像我們構建一個精細的故事來解釋被告的行為一樣,我們同樣可能在其他情境中對我們遇到的個體構建故事或個人模型(Park,Dekay,& Kraus,1994)。你可能構建一個精妙的故事,來解釋一個朋友的婚姻為什麼破裂了?你的一個熟人為什麼不能保住其鐵飯碗?為什麼你五年級的老師一直不喜歡你?對於同一個人或同一件事,不同的人構建的模型是不同的,特別是在他們對社會環境的本質持有不同看法的情況下。解釋的連貫性原則可以用來確定人們偏愛哪個“個人模型”。

至此,我們已經討論了人們如何確定和判斷其過去和現在的事實。接下來將探討與真實事實相反的“反事實現象”。

反事實思維

猶太人有一種傳統的祈禱儀式,在重大意外事故、嚴重疾病、戰爭和其他危及生命事件中倖存後,感恩上帝賜予他們重生。為什麼那些剛剛經歷不幸,或者仍然經受疾病和痛苦折磨的人們,仍然心存感激和慶幸自己免於更悲慘的命運呢?倖免於難,我們會覺得自己的運氣很好,因為我們很容易想到同一事件會有更加悲慘的結果。我們必然認為,如果事情稍微有些改變,我們可能已經死了。相反,如果事情的結果的確非常悲慘,我們就會有一種想法縈繞心頭,那讓人備受折磨,這種想法就是,災難本應很容易就可以避免的。很多事件使我們產生這種反事實結果,就是與實際結果相反的、可能發生的、可以發生的、本應發生而最終沒有發生的結果。對某一事件產生的反應中出現了反事實,會影響我們對事件的理解和情感反應。

事件常態

某些反事實比其他反事實容易想像(Kahneman & Tversky,1982)。例如,你在一台“老虎機”上玩了半個小時,沒有中獎,白白浪費了幾美元。別人在你剛剛玩過的老虎機上,第一局就中了一萬美元的頭獎。你會比當時沒有中獎的其他人更為沮喪和失望,因為你更容易想像,只要多投一個硬幣自己就會中頭獎……