讀古今文學網 > 思維的發現:關於決策與判斷的科學 > 第五章 碰撞:小白鼠與巨蟒 >

第五章 碰撞:小白鼠與巨蟒

尼爾和阿莫斯同在密歇根大學待過6個月,但是兩人從未有過交集,兩人的思想火花也從未發生過碰撞。丹尼爾在這棟樓裡研究人的瞳孔,阿莫斯在另一棟樓裡用數學模型分析相似性和決策制定。「我們之間沒有什麼共同話題。」丹尼爾說。因此,在1969年的春天,當阿莫斯出現在丹尼爾的研討課上時,十幾個研究生都感到意外。之前,丹尼爾從未邀請過什麼人來做嘉賓,研討課就是他一個人的秀場。在他那以現實問題為依托而展開的應用心理學課堂上,阿莫斯和其他所有心理學家一樣,顯得格格不入。而且,兩個人之間看似也不太和諧。「學生們覺得,丹尼爾和阿莫斯好像彼此較著一股勁兒,」研討會上的一個研究生說,「兩位心理學系的明星人物不知怎麼並不在一個步調上。」

在離開以色列去北卡羅來納之前,阿姆農·拉波波特就有一種說不清道不明的感覺,覺得他和阿莫斯的存在讓丹尼爾不快。阿姆農說:「我認為他好像有些怕我們,有些懷疑我們。」而丹尼爾卻說,他僅僅是對阿莫斯·特沃斯基有些好奇。「我想我得找個機會多瞭解瞭解他。」丹尼爾說。

丹尼爾把阿莫斯請到自己的研討課上,讓他願意講什麼就講什麼。出乎他的意料,阿莫斯沒有聊自己的研究——他的研究工作還停留在抽像的理論階段,也許是他覺得不適合研討課的氛圍吧。稍加留意就會發現,阿莫斯的研究幾乎沒有與真實世界發生任何關聯,在他癡迷於那個抽像世界的同時,丹尼爾卻在專注於思考真實世界的問題,儘管他總是在生活中刻意和別人保持距離。

如今人們提起阿莫斯,會說他是一個「數學心理學家」,這多少讓人有些不解。在丹尼爾這一類不研究數學的心理學家眼中,數學心理學家基本上就是那些打著數學的幌子,去掩蓋他們對心理學的無知,並因此做出一些毫無意義之事的人。而從數學心理學家的角度來看,不懂數學的心理學家純粹是愚不可及,根本不會理解他們的研究有多重要。當時,阿莫斯正與一幫數學天賦超群的美國學者一道,完成一個三卷本的、內容龐雜、公式密集的教科書,名為《測量基礎》——1000多頁有關測量的論證和實例。這本書一方面是純理論的精彩呈現,另一方面卻像是幽谷琴音——如果沒有人聽得到,再美妙的琴音又有何意義?

所以,阿莫斯在丹尼爾的研討課上沒有聊自己,反而聊到了密歇根大學沃德·愛德華茲實驗室裡正在進行的一項前沿研究,關乎人類在決策制定過程中如何對新信息做出反應。據他介紹,研究人員把滿滿兩口袋籌碼放在被試面前,每隻口袋裡都有紅白兩種顏色的籌碼。其中一隻口袋裡,75%的籌碼是白色,25%的籌碼是紅色。另一隻口袋裡正好相反,75%是紅色,25%是白色。被試隨機挑選一隻口袋,然後把籌碼一個接一個往外拿,其間不得向袋子裡面看。每拿出一個籌碼,他都需向研究人員匯報他的猜測:他手中的袋子究竟是白色籌碼居多,還是紅色籌碼居多?

這個實驗的妙處在於,以下這個問題能夠得到一個準確的答案:我有多大概率會選中紅色籌碼居多的口袋?解答它靠的是統計學中的貝葉斯定理(以托馬斯·貝葉斯的名字命名。他於1761年去世,奇怪的是,人們是在他死後才在其論文中發現了這個定理)。每當被試從袋中拿出一個籌碼,貝葉斯定理都能讓他們算出手頭這個口袋紅色居多的概率或者白色居多的概率。在拿出第一個籌碼前,這個概率是50︰50,也就是說,被試手中的口袋有50%的可能性是紅色居多,另有50%的可能性是白色居多。但是,當籌碼被一個接一個拿出後,概率會發生怎樣的變化?

從大的方面來說,概率的變化取決於所謂的基準率,也就是袋中紅白兩色籌碼各佔多少百分比(這個百分比信息應該是已知的)。假如你知道這只口袋中紅色籌碼占99%,另一隻口袋中白色籌碼占99%,那你拿出一個籌碼後所判斷的概率準確性一定遠遠高於基準率僅為51%時的準確性。但是除此之外,它還能說明什麼?把基準率輸入貝葉斯的公式,你就能得出答案。當口袋中的紅白兩色籌碼各佔75%和25%,或是25%和75%時,假如你連續三次抽出的是紅色籌碼,那麼你手中口袋以紅色籌碼居多的概率就該乘以3;假如你連續三次抽中白色籌碼,則口袋中以紅色籌碼居多的概率就該除以3。如果你第一次抽出的是紅色,那麼口袋中以紅色居多的概率就是3︰1(或者說75%)。如果你第二次抽出的還是紅色,那概率就增加到9︰1(或者說90%)。假如第三次你抽出了白色,則概率又會降至3︰1。以此類推。

基準率越大,也就是紅色籌碼和白色籌碼之間的比例越大,概率變化得就越快。當你從紅白比例為75%和25%的口袋中抽出的頭三個籌碼全是紅色時,那就意味著這只口袋有27︰1的概率,或者略高於96%的概率,是以紅色居多。

實驗室裡不知情的被試們在抽取撲克牌籌碼時,可不知道什麼貝葉斯定理。如果知道,那實驗就沒法做了。他們必須靠猜,以便心理學家能將他們的猜測和真實結果做一番對比。從他們的猜測中,心理學家希望能有所發現,看看人的大腦在面對新的信息時,其加工過程與統計計算之間有沒有共性。心理學家想知道,人究竟是不是天生的統計高手?當他們不依賴統計公式時,是不是還能夠做出準確的猜測?

當時,這項實驗給人耳目一新的感覺。心理學家認為,他們的研究成果可以用來解釋生活中的各種問題:投資人如何根據收益報告決定下一步行動,病人如何根據醫生的診斷判斷自己的身體狀況?政策制定者如何根據民意調查制定下一輪政策?教練如何根據新的進球部署下一步戰略?20歲的女性在檢查胸部時被診斷為乳腺癌,那麼比起接受同樣檢查的40歲女性,她被誤診的可能性要高得多(因為基準率不同:20歲女性罹患乳腺癌的概率比40歲女性要小得多)。她是否能預感到自己患病的概率?如果能,準確率是多少?生活中這樣的概率遊戲俯拾皆是:人們在遊戲中表現得如何?準確評估信息的概率是高還是低?人們是如何依據線索得出結論、做出判斷的?人們對下一步態勢的概率預測是否會因為新情況的出現而改變?

至於最後這個問題,阿莫斯對丹尼爾班上的學生說,密歇根大學的教授們給出了明確的答案:是。他向大家介紹了沃德·愛德華茲實驗室裡的研究,研究表明,當被試從口袋中抽出的是紅色籌碼時,他們更傾向於認為該口袋裡紅色籌碼佔多數。假如他們抽出的頭三個籌碼都是紅色,那麼他們認為袋中籌碼以紅色為主的概率就變成了之前的3倍。他們的判斷沒錯,只不過,根據貝葉斯定理的計算結果,概率其實變成了之前的27倍。換言之,他們的判斷方向是正確的,就是轉換的幅度沒有那麼大。為了描述人們在面對新情況時是如何做出反應的,沃德·愛德華茲實驗室的研究人員發明了一個詞,叫「保守的貝葉斯人」,意思是說,人們的所作所為很像是依靠公式完成的。當然了,沒有人真的以為貝葉斯公式被植入了我們的大腦。

愛德華茲實驗室的人員,還有其他許多社會科學研究者,都相信(好像也願意相信)人們的行為好像和貝葉斯公式脫不開干係。這一觀點與當時社會學研究中的主流觀點不謀而合。1953年,經濟學家米爾頓·弗裡德曼發文指出,人們打檯球時,不會去計算擊出母球時應該採取什麼角度,或是使用多大力量。那是物理學家研究的東西。但在打球時,人們就好像精通物理,會從大致準確的角度,以大致適宜的力量,去擊球。他們的大腦會形成一個接近標準答案的選擇。至於大腦是如何做出這個選擇的,並不是我們關注的重點。同樣,人們在某些情境中判斷概率時,其實並沒有做任何的精密計算,但準確率之高往往顯得他們好像做過計算似的。

阿莫斯講完了,丹尼爾卻陷入了迷惑。就是這樣嗎?丹尼爾說:「阿莫斯以一種人們慣用的方式,描述了那些讓人肅然起敬的同行們所做的研究。聽完後,你會覺得還不錯,你會選擇相信他們。每每讀到刊載在核心期刊上的文章,我們都會折服於它的表面價值,會以為作者所言必然有其道理,否則它也不會出現在這樣的期刊上。」可是,阿莫斯所講的這項試驗,卻讓丹尼爾覺得格外荒唐。人從袋子裡抽出一個紅色籌碼後,會比先前更確信這個袋子是以紅色籌碼居多:呵,多新鮮哪,難不成他還會有別的想法?丹尼爾以前從沒有接觸過此類研究,對於人在做抉擇時的思維狀態,他並不瞭解。「我從未過多地關注過思維。」丹尼爾說。他對思維的認識,還停留在把思維當成「看見」的階段。而這項涉及思維的研究,據他所知,與人們在生活中的真實做法並不一致。眼睛見到的,耳朵聽到的,往往會是錯覺和假象。

丹尼爾最鍾愛的格式塔心理學家們,正是從視覺幻象中取得了重大發現:明知是錯覺,人還是難免被誤導。因此,丹尼爾覺得思維是個不值得信賴的東西。人不是天生的統計高手,人的大腦也不會理所當然地提供「正確」答案——要想明白這個道理,你只需在希伯來大學隨便找堂統計課聽一聽就足矣。學生們並不是一生下來就知道基準率的重要性。他們無論是從大樣本還是從小樣本中,都有可能得出一個重大的結論。丹尼爾——他本人就是希伯來大學最好的統計學教授——就曾在事後發現,他當初從以色列兒童選擇帳篷的傾向中總結出的結論,無法被複製推廣,因為樣本量太小了。他只調查了少數幾個孩子,研究結果並不一定適用於大多數人。換句話說,他曾認為幾個撲克籌碼和幾把撲克籌碼的作用是一樣的,都能清楚地透露袋中的情況。

在丹尼爾看來,人類並不是「保守的貝葉斯人」,也不是任何一種類型的統計學家。他們常常是依據細枝末節直接做出判斷。說人的大腦就像統計學家一樣精準,不過是個比喻。但是丹尼爾覺得,這個比喻並不恰當。「我知道自己是個靠直覺做判斷的討厭鬼,」他說,「而且也知道自己一點兒也不比別人更愚蠢。」

沃德·愛德華茲實驗室的心理學家與奧斯汀·裡格斯中心的精神分析專家堪有一比,丹尼爾之所以對他們抱有同樣多的興趣,是因為這二者都不能正視自己的愚蠢。阿莫斯所介紹的這個實驗只能吸引那些秉承如下觀點的人:人的直覺判斷接近正確答案,他們基本上算是出色的統計學家。

稍加思索,你會發現其中的荒謬之處。現實生活中,大部分事情並不像判斷哪只口袋裡裝有更多紅色籌碼那樣一清二楚。此類實驗充其量只能證明一件事:人們不善於通過直覺做判斷,不精於此道,因而連明擺在那裡的答案都看不到。預測口袋中籌碼顏色時表現出色的人,在遭遇更複雜的情境時也會舉棋不定,比如預測某個國外的獨裁者究竟是不是擁有殺傷性武器。丹尼爾認為,當人們依附於理論時,上述情況就會發生。他們會讓證據去順應理論,而非讓理論來檢驗證據。每當這時,他們的觀點就難免偏頗。

無論在哪兒,我們都能看到蠢話被當成真理的事例,其原因就是這些蠢話被披上了理論的外衣,和科學家的研究工作捆綁在了一起。丹尼爾說:「想想看吧,心理學家幾十年來一直認為可以通過學習解釋人類行為,所以他們去觀察飢餓的老鼠如何學習在迷宮中找到方向。這就是他們幹的事兒。連智商平平、學識不高的人都認為他們在瞎扯,可他們還在全情投入地研究著被我們視為垃圾的東西。」

研究人類決策制定這一新命題的人們也同樣被理論蒙蔽了雙眼。「保守的貝葉斯人」這個字眼一文不值。丹尼爾說:「它的意思是人們知道正確答案,並且盜用了正確答案,而非心理活動所致。人們在判斷這些可能性時都做了些什麼?」阿莫斯本人就是個心理學家,但他在描述這項與心理學毫無關聯的實驗時,明顯持肯定態度,或者說至少是沒有質疑。「給人的感覺就像是做數學題。」丹尼爾說。正因為如此,當丹尼爾聽到那些白癡理論時,他做了一件希伯來大學任何一個有德行的人都會做的事:他和阿莫斯爭辯了起來。丹尼爾後來解釋說:「他經常說是我『讓他下不來台』,就連朋友聊天時都會這樣說。人人有權表達觀點——這是美國人的規矩,在耶路撒冷,我們可不這麼幹。」

研討會接近尾聲時,丹尼爾顯然覺察到了,阿莫斯無力再和他爭辯下去。回到家中,丹尼爾對妻子愛麗琦誇口說,自己辯贏了一個桀驁不馴的年輕同事。也可能這是愛麗琦根據記憶所總結的。「這是以色列式辯論的一個重要時刻,」丹尼爾說,「雙方都是雄辯家。」

在阿莫斯的人生歷程中,他很少在辯論中屈居下風,被對方說服的時候更是少之又少。「你絕不能說他錯了,即便他真的錯了也不行。」阿莫斯的學生祖爾·沙皮拉說。並不是因為阿莫斯刻板教條。與人討論時,阿莫斯總是隨心所欲,大膽直言,樂於接受新想法和新觀點——儘管多數時候這些觀點與他的觀點之間並不存在明顯衝突。可能是因為他往往是正確的那一方,以至於在每一場辯論中,所有人,包括他自己,都會理所應當地認為「阿莫斯是對的」。在被問及對阿莫斯的印象時,諾貝爾獎得主、希伯來大學經濟學教授羅伯特·奧曼回憶起的第一件事,就是有一次他的觀點讓阿莫斯感到了驚訝。奧曼說:「我記得他說『我從來沒有想到過這個』,我之所以記得這件事,是因為很少有什麼東西是阿莫斯不曾想到過的。」

丹尼爾後來懷疑,阿莫斯可能壓根兒就沒有認真地思考過人類思維與貝葉斯統計之間的關係——這不是他的研究方向。丹尼爾說:「可能他從來沒有和別人嚴肅地探討過這個問題,即便有,也沒人會提出如此明確的反對意見。」人們以做數學題的方式進行統計分析,大部分人能算出7×8=56,但假如有人算不出呢?他們有可能犯各式各樣的錯誤。並不是像有些人說的,人的大腦自帶一種做數學題的機制,能讓他們的錯誤具有系統性。假如有人問阿莫斯:「你認為人類是保守的貝葉斯人嗎?」那他可能會說:「當然不是所有人,但是作為一種宏觀描述,它是成立的。」

至少在1969年的春季,阿莫斯對於社會科學領域的主要理論還不是特別排斥。和丹尼爾不同,他並不拒絕理論。對他而言,理論好似一個思維的口袋,裡面可以容納任何你想要容納的觀點。在沒有找到一個更好的理論——能夠更好地發揮預測功能——之前,舊理論不該被擯棄。理論決定著知識,它使我們有望進行更準確的預測。當時,社會科學領域最具影響力的理論就是,人類是理性的——至少可以說,是稱職的直覺型統計學家。他們善於詮釋新信息,能夠在各種可能性之間做出判斷。當然,他們也會有出錯的時候,但所犯錯誤往往是情緒使然,而情緒具有隨機性,因此可以被忽略不計。

可是這一次,阿莫斯內心的某種東西發生了改變。離開丹尼爾的研討課時,他的思緒陷入了一種罕見的狀態:懷疑。那些他曾經或多或少認為站得住腳的理論,如今變得令人生疑。

阿莫斯的密友們看出了他的驚人變化。在他們眼中,阿莫斯實際上一直都抱有這種懷疑心態。有一次,他說起了以色列軍官在帶領部隊穿越沙漠時遇到的一個問題,也是他親身經歷過的難題。在沙漠中,肉眼很難判斷形狀和遠近,因而不太容易確定行進方向。「這一點讓阿莫斯格外頭疼。」他的朋友阿維沙·瑪格裡特說,「帶兵時,你得不停地確定行進方向,阿莫斯精於此道,但即便如此,在沙漠中也會覺得困難。夜間行軍時,看見遠處的燈光,你會想,這光是近還是遠?看見水源,你以為只相隔一千米,最後卻花了幾個小時才走到。」作為以色列士兵,要想保家衛國,就必須瞭解這個國家,可這個國家又是那麼難以瞭解。阿莫斯手裡有軍用地圖,但多數時候,地圖都派不上用場。不期而至的風暴會徹底改變沙漠中的景觀,今天尚在此處的山谷,風暴後卻出現在了彼處。在沙漠中帶兵讓阿莫斯對視覺錯覺的感知更加明瞭:視覺錯覺會要人的命。20世紀五六十年代,假如帶兵的以色列軍官在沙漠中迷失了方向,那麼士兵就會不服管束。因為大家很清楚,迷路與死亡僅有一步之遙。阿莫斯感到不解:既然人類具有適應環境的能力,為什麼對環境的感知還會出錯?

阿莫斯對於決策制定領域其他理論學家的觀點並不完全認同,這一點在其他一些事情上也體現了出來。數月前,在還沒有參與丹尼爾的研討課時,他被召回軍中,前往戈蘭高地服預備役。當時那裡並沒有戰事,他的職責就是指揮新佔領區域的一支隊伍,監視敘利亞士兵的動向,以判斷他們是否有進攻的企圖。他手下有一個即將赴斯坦福大學任數學教授的學者,名叫伊茲·卡茲內爾森。和阿莫斯一樣,卡茲內爾森的童年時代也在耶路撒冷度過,正趕上1948年的獨立戰爭,當年的情景早已成為他記憶中的烙印。他清楚地記得,猶太人闖入逃離的阿拉伯人的家中,把值錢的東西洗劫一空。「我心想,那些阿拉伯人和我一樣,都不是戰爭的始作俑者。」卡茲內爾森說。當時,他跟著人群跑進一個阿拉伯人的家裡,看到一些猶太中學生正揮刀砍一架鋼琴——僅僅是為了獲取木材。卡茲內爾森和阿莫斯沒有談起這些——這些事最好被塵封起來。

他們二人談到的,是新近引起阿莫斯好奇心的一件事:人們是如何對不確定事件的發生概率做出判斷的?比如,在當時,敘利亞軍隊發起進攻的可能性是多大?卡茲內爾森回憶說:「我們就站在那兒監視著敘利亞士兵,聽他談著可能性,以及如何確定可能性。他感興趣的是,1956年西奈戰役爆發前,政府為何會認為戰爭持續不了5年,而另有人認為戰爭持續不了10年。阿莫斯想要說明的是,可能性是不確定的。人們並不知道如何對可能性做出正確的判斷。」

自阿莫斯返回以色列後,假如說他的心中原已產生了裂痕,那麼和丹尼爾的這番交集無疑引發了一場地震。那之後不久,他遇見了阿維沙·瑪格裡特。「我在走廊裡等人,」瑪格裡特說,「阿莫斯走了過來,一臉的心煩意亂。他把我拽進辦公室,對我說,『你想像不到我剛才經歷了什麼』。他向我說了去丹尼爾那裡講課的事情,說丹尼爾的反應是『講得很精彩,但是我壓根兒就不信』。他看起來是真的覺得很困擾,我只能盡力安慰他。他說,『判斷力與感知力不可能毫無干係。思考並不是一種孤立的行為』。」當時的最新研究探討的是人在做出客觀判斷時,思維在如何運作。但是這些研究並沒有涉及其他時刻思維的運作方式。「阿莫斯的這次經歷意義重大,」丹尼爾說,「他曾經信奉的那套觀點,那套使沃德·愛德華茲的研究能夠成立的觀點,在這個下午之後,被另一套觀點取而代之了。在新觀點的參照下,沃德·愛德華茲的研究顯得荒唐極了。」

研討會之後,阿莫斯和丹尼爾有過幾次共進午餐的機會,但兩人依然是各幹各的。同年夏天,阿莫斯去了美國;丹尼爾去了英國,繼續開展他的注意力研究。對於這一研究可能具有的價值,丹尼爾已經瞭然於心。以坦克戰為例。在研究中,丹尼爾嘗試給被試的左耳輸送一組數字信號,給右耳輸送另一組數字信號,然後檢測他們能以多快的速度在左右耳收聽到的信號之間進行切換,以及他們的思維是否能成功地阻隔那些本該被忽略掉的信息。「坦克戰和西部槍戰一樣,作戰方確認目標繼而採取行動的速度決定著他們的生死。」丹尼爾後來說道。利用這一測試,他可以知道哪一個坦克指揮官能夠憑借感覺做出最佳判斷——以最快的速度識別相關信號,並聚焦於此,而不是被對方的炮火炸成碎片。

1969年秋,阿莫斯和丹尼爾均已回到了希伯來大學。除了睡覺時間,兩人基本上形影不離。丹尼爾習慣早起,所以午飯前的時段人們可以找到他。阿莫斯是個夜貓子,深夜時分去打擾他都不為過。至於其他時間,他們會從公眾的視野中消失,一起躲進一間研討室。路過的人有時會聽見兩人在裡面大聲爭執,但更多時候,裡面傳出的是笑聲。大家推斷,他們二人一定在討論格外有趣同時也是格外私密的某些事情,因為從來沒有人受邀參與過他們的談話。假如你在門口駐足傾聽,也只能聽到裡面的人在用英語和希伯來語交流。他們在兩種語言間來回切換,尤其是阿莫斯,每當他情緒激動時,就會使用希伯來語。

在過去,希伯來大學最聰明的這兩個人總是和對方保持著距離,而如今,性格迥異的他們竟有了如此多的共同之處,而且竟然成了知己。這一切不禁讓學生們感到匪夷所思。「很難想像他們之間發生了什麼化學反應。」曾經師從二人的心理學研究生迪薩·卡夫裡這樣說。丹尼爾在童年時經歷過大屠殺,而阿莫斯,照老話來說,是個「土生土長的以色列人」。丹尼爾總認為自己是錯的,阿莫斯卻總認為自己是對的。丹尼爾不愛參加聚會,阿莫斯卻總是聚會中的核心人物。丹尼爾行事正統,阿莫斯卻隨性灑脫、不拘小節。和阿莫斯在一起,你隨時都能找到一見如故的感覺;而和丹尼爾在一起,即便你昨天剛剛和他聊過天,也會覺得生分,好像又得重新去認識他。阿莫斯是個樂盲,但總會熱情似火地哼唱希伯來語的民謠;丹尼爾儘管有副好歌喉,卻甘願將它埋沒起來。面對不合邏輯的論調,阿莫斯會斷然將其推翻;丹尼爾則總會問「這有沒有可能在某種情況下是成立的?」丹尼爾是個悲觀主義者;阿莫斯卻是個樂天派,他志在於此,因為悲觀主義在他眼中是愚蠢的代名詞。阿莫斯總是說,當你悲觀時,定會有壞事成倍地發生,當你憂慮時,憂愁定會再次找上門。他們在希伯來大學的同事說:「他們是截然不同的兩種人,丹尼爾儘管脾氣急躁,但還是常常以讓別人高興為己任。阿莫斯卻無法理解為什麼要去曲意逢迎。他也知道謙卑有禮的必要性,卻不懂為什麼要刻意為之。」丹尼爾把許多事都看得很重,阿莫斯卻慣用戲謔的心態面對生活。受希伯來大學任命擔當博士學位評定委員會成員後,阿莫斯對一篇人文學科博士論文的粗製濫造深感驚訝,但他沒有直接提出反對意見,而是說:「如果這篇博士論文在其領域內稱得上好,那我這兒沒問題,但前提是這個作者能夠清楚地劃分章節!」

除此之外,阿莫斯還是人們所見過的擁有最恐怖大腦的一個人。「人們不敢在他的面前探討問題。」他的友人說,因為大家擔心他會不客氣地指出那些他們並未清楚意識到的漏洞。阿莫斯曾經的一位研究生露瑪·福爾克說,她因為害怕阿莫斯挑剔她的駕駛技術,而在用車送他回家時堅持讓阿莫斯自己開車。如今,阿莫斯的空閒時間都是和丹尼爾一起度過。後者的內心極度敏感,以至於學生的一次差評都會讓他長時間地陷入自我懷疑的陰鬱之境。把他和阿莫斯放在一起,就像把小白鼠扔進了巨蟒的地盤,可待你回頭再看時,卻發現小白鼠在滔滔不絕,而巨蟒蜷縮在角落安靜地傾聽。

其實他們二人也有不少共同之處。首先,兩個人都是東歐猶太拉比的後裔。其次,對於人們在「正常的」非情感狀態下會有何種表現,他們都極感興趣。他們都樂意開展科學研究,都希望能找尋到簡單而有力的真理。丹尼爾的個性也許算得上複雜,但他依然想要做一個「只研究某一類問題的心理學家」;阿莫斯的研究也許也算得上複雜,但他的最大願望是透過重重廢話找尋出問題的核心。兩人都擁有令人瞠目的豐富思想,都是生活在以色列的猶太人,都不信仰上帝。但即便如此,大家注意到的依然是他們之間的差異。

至於兩人間的巨大差異,最有力的證據莫過於他們辦公室的狀態了。丹尼爾的辦公助理丹妮拉·戈登回憶說:「丹尼爾的辦公室亂成一團,寫有一兩句話的紙片隨處都是。到處都是書,到處都是紙。書總是那樣攤開著,以方便他下次接著讀。有一回,我看到自己的碩士論文被翻到第13頁——我猜他是剛讀到那兒。相隔三四間房的地方,是阿莫斯的辦公室,而那裡,除了桌上的一支筆,什麼都沒有。你在丹尼爾的辦公室找不到東西,是因為那裡太亂;而在阿莫斯的辦公室找不到東西,是因為那裡根本沒有東西。」周圍人冷眼旁觀地揣摩著:為什麼他們會相處融洽?一位同事說:「丹尼爾是個難伺候的主兒,阿莫斯又最不買這類人的賬,但在丹尼爾面前阿莫斯甘願遷就,實在讓人感到意外。」

關於兩人獨處時都在做什麼,丹尼爾和阿莫斯並沒有過多提及,但避而不談越發激起了周圍人的好奇心。剛開始,他們其實還是圍繞丹尼爾的那個命題在談——人類不是貝葉斯人,不是保守的統計學家,不是任何一類統計學家。不管人們在面臨概率選擇時做了何種決斷,都與統計學無關。但是如何才能讓被理論或多或少蒙蔽了雙眼的社會學家接受這一觀點?如何去驗證這一觀點?二人決定,要設計出一個打破常規的統計測試,交給科學家去檢驗一下成效。他們將以真實數據為依托,根據人們給出的問卷答案來設計這套統計工具。在此,所選的被試都具備統計學知識,都清楚何為概率理論。問卷中的問題多數是丹尼爾構想出來的,其中有很多是升級版的「紅色籌碼還是白色籌碼」類問題,比如:

某市八年級學生的平均智商是100。為檢驗當地的教育水平,你隨機選擇了50名學生接受測試。第一個學生的智商測試得分為150,請判斷這50名學生的平均智商。

1969年夏末,丹尼爾設計的這些問題被阿莫斯帶到了在華盛頓特區召開的美國心理學年會上,之後又被帶到了數學心理學大會上。在那裡,一屋子有著極高統計學素養的專家接受了他的測試,其中有兩人還曾出版過統計學教科書。測試結束後,阿莫斯將測試結果收集完畢,與它們一同乘飛機返回了耶路撒冷。

在耶路撒冷,他和丹尼爾首度坐在一起動手寫論文。辦公室太小,所以他們在一間小研討室展開了工作。阿莫斯不會打字,丹尼爾又不喜歡打字,所以兩人就拿著筆記本坐在了一起。他們對每一個句子都會仔細斟酌,每天最多能寫完一至兩個段落。「我有一種感覺:哦,這絕對不是一番尋常的體驗,」丹尼爾說,「因為這一切太有意思了。」

回望那段時光,丹尼爾記得最清楚的莫過於笑聲——也就是屋外路過的人聽到的笑聲。「我腦海中有一個畫面,就是試圖讓椅子靠其後腿保持平衡時,我因為笑得太厲害差點兒摔到地上。」如果兩人因為阿莫斯的笑話而大笑,那笑聲往往還要更大些,主要原因是,阿莫斯慣於對自己講的笑話笑個沒完。(「他太搞笑了,所以就算是自說自話地發笑,也很正常。」)在阿莫斯的陪伴下,丹尼爾也變有趣了——之前他從未有過這樣的體驗。而在丹尼爾的影響下,阿莫斯就像換了一個人,他不再挑剔;或者,至少對丹尼爾提出的所有想法,他不再吹毛求疵。他甚至都不再開玩笑。他以前所未有的方式讓丹尼爾感受到了自信,而丹尼爾也平生頭一回體驗到了進攻者的滋味。「阿莫斯從不會以防禦者的低姿態去寫作,」丹尼爾說,「他有一股自然流露的傲慢氣質,覺得自己比所有人都聰明。」完稿後的文章處處都透著阿莫斯的那股自信勁兒,首當其衝的就是文章標題:「小數定律之我見」。然而,文章是兩人完美合作的結晶,所以到署名時,他們都認為自己不能覬覦第一作者的寶座,於是靠拋硬幣做了決定,最終是阿莫斯贏了。

《小數定律之我見》這篇文章對於人們——包括訓練有素的統計學家——常犯的一個思維偏誤進行了系統的梳理。文章指出,人們會錯誤地以為局部能夠代替整體。就連統計學家也會從不足以說明問題的少量證據中武斷地得出結論。丹尼爾和阿莫斯認為,之所以如此,是因為人們錯誤地相信——他們不認可也罷——樣本必能反映出總體的特性。

在人們對待隨機事件的態度中,這種思維偏誤表現得尤為明顯。以拋硬幣為例。人們都知道,硬幣落下時,正面朝上和反面朝上的概率是一樣的。但是,他們依然認為,如果一個硬幣連續多次都是正面朝上落下,那麼下一次極有可能會反面朝上。這就是人們常說的「賭徒的謬誤」。人們似乎以為,硬幣能夠自動地調節正反面,好讓它們機會均等。「即便是最公正的硬幣,鑒於其有限的記憶容量和道德水準,始終不可能像賭徒們期待的那樣做到不偏不倚。」他們在文中寫道。這句玩笑話顯然是學術期刊中的另類。

他們接著又指出,受過訓練的科學家——參與實驗的心理學家們——也同樣會犯此類錯誤。例如,當這些心理學家只知道第一個孩子的智商得分是150,然後要去猜測一群孩子的平均智商時,他們給出的答案是100,也就是說,他們認為八年級孩子的平均智商是100。在他們看來,智商超高和智商超低的孩子都是群組中的特例,會兩相抵消——就像硬幣,這次正面朝上,下次就會反面朝上。只不過,貝葉斯定理的計算結果顯示,孩子們的平均智商是101。

即便是精通統計學、瞭解概率論的專家,都沒有意識到小樣本在代表大群組時所具有的差異性,即樣本量越小,其準確反映整體特質的可能性就越低。人們總以為樣本能夠自我調節,直至可以準確反映它所代表的整體。在大群組中,由於大數定律的影響,其預測準確性是可以得到保障的。假如你拋擲硬幣多達1000次,那麼最終正面朝上和反面朝上的次數基本會相等;而拋擲10次時,結果就不盡然了。出於說不清道不明的原因,人們就是看不到這一點。「人們對於隨機取樣所抱的態度似乎是符合小數定律的。也就是說,他們認為小樣本和大樣本一樣,都能反映出它所代表的整體的特性。」丹尼爾和阿莫斯在文中寫道。

人類的這種直覺偏誤在很多領域都產生了重要影響,例如人是如何行走於四方,如何做判斷,以及如何做決定。但是丹尼爾和阿莫斯這篇最終刊發在《心理學公報》上的文章,卻主要闡述了直覺偏誤對於社會科學的影響。在社會科學實驗中,科學家往往從大群體中選取一個小樣本,然後來檢驗某個理論。比如,某位心理學家認為,野營時孩子對單人帳篷和多人帳篷的不同選擇可能與他們是否熱衷社交活動緊密相關。他挑選了12個孩子作為調查對象,從中驗證了他的猜想。但是在現實中,並非所有願意單獨睡的孩子都排斥社交,也並非所有願與多人同睡的孩子都擅長社交。為了確保研究結論的嚴謹性,這位心理學家又選取了另一組孩子作為樣本,想看看上述結論是否適用。可是,對於多大的樣本量才能正確反映整體特徵,他做出了錯誤的判斷,因此即便第二次調查驗證了他的結論,也只能說是僥倖成之。[1] 鑒於小樣本固有的差異性特徵,第二次調查結果有可能是完全不同的,根本不能反映大多數孩子的情況。可即便如此,他還是會堅持己見,認為樣本在進行自我調控,一會兒能驗證他的假設,一會兒又能推翻他的假設。

這就是丹尼爾和阿莫斯眼中很多心理學家所陷入的一個思維誤區:認為小樣本亦能反映群體特徵。丹尼爾本人也不例外。比起大多數心理學家,甚至大多數統計學家,丹尼爾的統計學知識都要更勝一籌。他和阿莫斯的這項研究,可以說是他對自己的研究工作發起的質疑。他渴望從中找出漏洞,到了有點兒迫不及待的地步。丹尼爾熱衷於自我糾錯的這種態度,為兩人的研究注入了極有價值的內容。事實證明,丹尼爾不是唯一一個會犯此類錯誤的人,每個人都會犯。這不是哪一個人的問題,而是人性中普遍存在的一個弱點。至少,他們二人是這樣認為的。

對心理學家進行的測試驗證了他們的懷疑。在判斷哪一個口袋中紅色籌碼居多時,心理學家往往會通過少數幾個籌碼的顏色來做出判斷。在探尋真相的過程中,他們過多地依賴了偶然性。此外,由於堅信小數定律,他們也總是會為自己的結論找出合理的解釋。

依據阿莫斯和丹尼爾設計的這套測試,心理學家需要回答一個問題:如何指導學生驗證一條心理學理論?比如,鼻子長的人更愛撒謊。當學生在樣本A身上驗證了這一假設,而在樣本B身上推翻了這一假設時,他該怎麼辦?丹尼爾和阿莫斯給這些參加測試的心理學專業人士提供的是多選題。四個選項中,有三個都是建議學生要麼增加樣本量,要麼進一步完善理論。結果,心理學家們幾乎是一邊倒地選擇了第四個答案:「他應該試著分析一下兩組樣本之間的差異。」

也就是說,當A組被試證實了「鼻子長的人更愛撒謊」,而B組被試證偽了「鼻子長的人更愛撒謊」這一假設時,學生應該為之提供一個合理解釋。心理學家對於小樣本的依賴程度之高,使他們堅信無論兩組的實驗結果有多大差異,都自有其道理。丹尼爾和阿莫斯寫道:「參與測試的心理學家很少會把超出預期的某個結果歸結於取樣變異性,因為他會隨意地『註解』任何一種不一致的情況。如此一來,他就很難發現是取樣變異性在作怪。他對小數定律的依賴會因而繼續存在下去。」

阿莫斯還補充道:「愛德華茲先生……曾指出,人們無法從一組隨機數據中提煉出足夠多的信息或是得出確鑿無疑的結論。他將這種情況歸結為『保守』。但是,在我們的研究中,很難用『保守』二字來形容被試。相反,就像相似性假說所總結的,他們過分依賴隨機數據,總是要大膽地從隨機數據中提煉出確定的結論。」(丹尼爾說:「沃德·愛德華茲在學術界地位顯赫,而我們卻對他大肆抨擊——阿莫斯的毒舌已經伸向他了。」)

當1970年年初這篇文章終於完工時,兩人已經記不清哪些內容是由哪個人執筆的了。很難說得清是阿莫斯的貢獻大,還是丹尼爾的貢獻大。但是丹尼爾認為,文章那自信甚至有些狂妄的文風無疑要歸功於阿莫斯。丹尼爾本人一直是一個謹小慎微的學者,他說:「假如是我獨自執筆,那麼除了引用上百條文獻並且用詞相當含蓄之外,我可能還會自謙一番,說自己不過是剛剛開悟的呆瓜。我原本也可能獨立完成這篇文章,但那樣一來,它可能不能引起大家的關注。文章如今具有一種明星氣質,這都是阿莫斯的功勞。」

丹尼爾認為僅憑他自己,文章不可能有這種風趣、狂放、富於挑釁性的特質。事實上,他認為阿莫斯對文章的貢獻也就僅止於此。完稿後,二人將文章交給了一位在他們看來極具懷疑精神的讀者,密歇根大學的心理學教授戴夫·克蘭茨。克蘭茨也是位嚴謹的數學家,與阿莫斯一同參與了《測量基礎》這一艱澀的大部頭教材的編寫。「我認為文章見地非凡,」克蘭茨回憶道,「我現在依然認為這是有史以來最有價值的文章之一。其他文章都反映出這樣一個宗旨:通過修正偏差,使之符合貝葉斯模式,繼而對人類決策做出解釋。這篇文章則完全不同。它與我之前的想法簡直是南轅北轍。在不確定的情境中,我們應該依靠統計學做出判斷,但實際上我們並沒有這樣做。他們選擇的研究被試都是統計學高手,可就連這些人都會犯錯!被試所答錯的每一個問題都是我自己也會答錯的。」

克蘭茨的這一評判——丹尼爾和阿莫斯的文章不僅有趣,而且意義重大——最終在心理學之外的領域也得到了響應。「經濟學家再三地說,『如果有證據表明某件事正確,那麼人們就會想方設法找出正確之處』,」哈佛大學的經濟學教授馬修·雷賓說,「實際上,人人都是出色的統計學家。如若不然,他們是活不下去的。所以,假如你想看看這世上哪些事情算得上重要之事,那麼人們不相信統計學這件事絕對位列其中。」

以丹尼爾的性格,他對於溢美之詞表現得非常淡然。(「當戴夫·克蘭茨說『這是一個重大發現』時,我還以為他在說胡話。」)但不可否認,他和阿莫斯所取得的發現,遠遠不止如何開展統計分析。人們習慣從少量證據中得出重大結論,這種傾向如此之強,以至於明知此處有陷阱,人們還是會主動跳下去。「人們對週遭世界長期以來的錯誤感知,使他們養成了靠直覺做判斷的習慣。」丹尼爾和阿莫斯在文章最後一段中寫道。這種錯誤感知深植於人類的思維中。在對不確定的世界進行概率判斷時,如果思維不是在依靠直覺得出結論,那它又在依靠什麼?如果思維並不像權威的社會科學家和經濟學理論認為的那樣運行,那它又是如何運行的?

[1] 當時,包括丹尼爾在內的很多心理學家都會選擇40個被試作為樣本,而這也只能保證他們的研究結論有50%的概率具有普適性。要想將這個概率提高到90%,樣本量至少得增加到130。但是大樣本檢驗需要更多的研究投入,整個研究進度會因此慢下來。