讀古今文學網 > 平均的終結:如何在崇尚標準化的世界中勝出 > 第3章 推翻平均標準 >

第3章 推翻平均標準

在早期漫長的職業生涯中,彼得·莫勒納爾(Peter Molenaar)是一位受人尊敬的平均主義科學家。他的心理發展研究大部分都是基於平均標準,並以此贏得了國際知名度。他對平均主義的價值深信不疑。有時候,莫勒納爾的同事表示行為科學家在研究個體時太過於依賴平均標準,他還會與之針鋒相對。[1]

莫勒納爾的自信看起來似乎合情合理,畢竟,他已經花了一輩子的時間潛心鑽研數學。高中時期,他入選參加了荷蘭奧林匹克數學競賽。他在自己的發展心理學專業博士畢業論文裡展示了高超的數學能力,描述了「由延遲的協方差函數的受限頻譜分解衍生出了一個動態因素模型,並由此分化出一個奇異份量和一個非奇異份量」。莫勒納爾後來的心理學文章裡常常列滿了方程式和證明過程,外行讀者可能會疑惑,這些文章裡到底有沒有心理學新發現呢?[2]

他憑著自己的數學天賦和對平均主義的執著,登上了荷蘭的學術之巔。2003年,莫勒納爾就成為H1教授,這是荷蘭教育系統裡的最高級別。他還是著名的阿姆斯特丹大學(University of Amsterdam)的心理系主任。但是在荷蘭,學術巔峰是有保質期的。荷蘭法律規定,所有H1教授都必須在62歲時從自己的職位上退下來,以便為後繼者留出位置,而在65歲時,必須完全退休。2003年,莫勒納爾59歲,他不確定自己是否為退居二線做好了準備,但是至少他很希望在自己的遊戲裡繼續策馬奔騰,直至學術生命的日落之時。此時,一個問題意外地擺在了他的面前。

那時,莫勒納爾只剩下三年的學術生涯了,由於一位同事突然被撤下來,學校安排莫勒納爾代替他去上秋季學期的一門課程,他還為此感到些許煩惱。這門課程是關於心理測驗的理論和方法的研討班。相信我,這種課聽上去就很無趣,學起來也一樣無趣。由兩位心理測量學家弗雷德裡克·羅德和梅爾文·諾維克編寫的教科書《心理測驗分數的統計理論》(Statistical Theories of Mental Test Scores )在1968年出版,常常被譽為「測驗的聖經」,書裡的許多測驗理論都被重新編寫進了現代教材。[3] 直到今天,對於所有希望設計、執行和理解標準化測驗的人來說,它依然是必讀書目;我在讀研究生時也必須讀這本書。這是那種你想盡快讀完了事的書,因為它的趣味性和納稅申報表相差無幾。實際上,這本大部頭的書太過枯燥無味,根本就沒人注意到在它那催人入睡的篇幅之中還隱藏著推翻平均主義的線索。

作為代課老師,莫勒納爾為了準備教學內容,翻開了他的那本羅德和諾維克之書。他將這一時刻稱為「aha-erlebnis」(頓悟,德語詞)。正是從這一刻起,他的生命歷程發生了巨大變化——社會科學的基石也由此被動搖。在這本書的序言裡,羅德和諾維克根據他們的觀察,認為所有心理測驗都試圖從某些興趣特點上辨別測驗者的「真實分數」。這樣做是很有意義的。我們讓別人做智力測試、性格測驗或大學入學考試,不就是因為我們想知道他們真實的智力排名、真正的性格類型和真正的天資差異嗎?

接著,羅德和諾維克觀察到,根據那時候的主流測驗理論——經典測驗理論[4] ——測定一個人的真實分數的唯一方法,是讓同一個人一遍又一遍地做同一套測試題,要做許多遍。[5] 讓被測試者反覆做題的必要性在於,據推測,每一次測驗過程中,比如數學測驗,都會出現一定數量的誤差(原因可能是測試者分心了或是餓了;可能她讀錯了一兩道題;也可能蒙對了)。但是如果你讓測試者多次做題,並取多次成績的平均數,那麼這個平均數就反映了這個人的真實水平。

但羅德和諾維克同樣充分地認識到,在實際操作中,不可能讓同一個人多次做同一測驗,因為人類會學習,任何做過測驗(比如數學測驗)的人若再次做同樣的題目,都會與上一次表現不同,這種現象不可避免,因此根本不可能得到多次獨立測驗的成績。[6] 但是羅德和諾維克並沒有承認失敗,而是提出了獲取真實分數的另一種方法:不是多次測試某一個人,而是同時測試許多人。[7] 根據經典測驗理論,用一個群體的分數來取代個體的多次分數是有效的。

阿道夫·凱特勒在差不多一個世紀之前,用「角鬥士的雕像」第一次比喻人類平均值的意義時,就用了同樣的概念演算。他宣稱,同一尊士兵雕像的1000個複製品的身材平均值等於1000名現實生活中的不同士兵的身材平均值。本質上,凱特勒與羅德和諾維克均假設,多次測量同一個人與一次性測量很多人是可互換的。

這就是莫勒納爾的頓悟時刻。他立刻意識到,羅德和諾維克奇特的假設方法不僅影響了測驗,而且所有以個體為研究對象的科學領域,均以相同的假設作為研究基礎。它對廣大範圍內的原本以為健全的科學研究方法的有效性提出了質疑,如私立學校的入學考試,天才計劃和特殊需求項目的選拔過程,評估身體健康、心理健康以及患病風險的診斷測試,大腦模式,體重增加模式,家庭暴力模式,投票行為模式,抑鬱症的治療,胰島素對治療糖尿病的應用,招聘政策和員工考核、薪酬和晉陞政策,以及學校的評分方法,等等。

這種假設相當奇怪,測量個體分佈的數值可以安全替代測量群體分佈的數值。然而,幾乎所有研究個體的科學家都默默地接受了這一假設,雖然很多時候他們幾乎意識不到這一點。但是,莫勒納爾在做了一輩子數學心理學研究後,不經意地看到這條白紙黑字拼寫出的錯誤假設時,他完全清楚自己看到了什麼:在平均主義的最核心地帶,存在一個無可辯駁的錯誤。

遍歷性誘導轉向

莫勒納爾認為,平均主義的致命弱點在於它的假設前提自相矛盾:通過忽視個體性來瞭解個體。他給這個錯誤取了個名字:「遍歷性轉向」(the ergodic switch)。這個詞取自數學的一個分支,那是科學界第一次討論群體與個體的關係,這個數學領域就是遍歷性理論。[8] 如果想要瞭解我們的學校、企業和人文科學為什麼淪為一種錯誤思想的犧牲品,那麼我們就必須瞭解遍歷性轉向是如何產生作用的。

19世紀末,物理學家正在研究氣體的運動。在那個時候,物理學家可以測量氣體分子的各種屬性,比如一罐氣體的體積、壓力和溫度,但是他們不知道一顆單獨的氣體分子是什麼樣子的,它是如何運動的。他們想弄明白,他們是否可以用一組氣體分子的平均運動模式來預測單個氣體分子的平均運動。為了解決這個問題,物理學家摸索出了一套數學原理,即遍歷性理論。這個理論詳細說明了,在什麼樣的情況下,你可以用群體的信息來得出有關群體中某一個體的相關信息。[9]

這個規則相當簡單明瞭。根據遍歷性理論,如果兩個條件成立的話,你就可以用群體的平均值來預測個體。這兩個條件是:(1)群體中的每一個體都是相同的;(2)群體中的所有個體都將保持不變。[10] 如果某個特定群體同時滿足了這兩個條件,那麼這個群體就具有「遍歷性」。只有在這種情況下,用群體的平均行為來預測個體行為才成立。然而事實上,對於19世紀的物理學家來說,大多數的氣體分子事實上都不具有遍歷性,不管它們看起來有多麼簡單。[11]

當然,你不必非要成為科學家才能看出來人也不具有遍歷性。「如果要用群體平均值來衡量個體,除非人類都是被冷凍的克隆體,完全相同且不會改變,」莫勒納爾給我解釋道[12] ,「但是很顯然,人們不是被冷凍的克隆體。」然而,即使是最基礎的平均主義方法,如排名和分類,都在假設人是被冷凍的克隆體。這就是為什麼莫勒納爾將這種前提假設稱為遍歷性轉向:它把非遍歷性的事物當作遍歷性的事物。我們也可以將遍歷性轉向看作某種聰明的「誘導轉向」,平均主義誘導科學家、教育者、企業領導者、招聘經理以及醫生相信,通過將個體與平均值相比較,就能得到與之相關的有意義的東西,然而他們卻忽略了與之相關的所有重要的東西。

舉個例子或許可以幫助我們理解遍歷性轉向的實際後果。想像一下,你想要通過減慢自己在鍵盤上打字的速度來降低打字的出錯率。如果用平均主義的方法來解決這個問題,就需要評估許多不同人的打字技巧,將平均打字速度與平均錯誤數量進行比較。如果這樣做,你會發現通常打字速度越快,出錯率就越低。這就出現遍歷性轉向了。平均主義者會做出如下結論:如果要降低打字出錯率,那麼就應該加快打字速度。然而事實上,打字速度快的人通常更熟練,因此他們出錯的數量就相對較少。但是這是基於「群體水平」得出的結論。如果基於個體水平來研究打字速度與出錯率的關係——比如,用不同的速度打字,並測量出錯的數量——那麼事實上,你會發現打字速度越快,出錯的數量越多。當你運用遍歷性轉向時——用群體信息替代個體信息——你就會得到完全錯誤的答案。

莫勒納爾的頓悟同樣也揭示了平均主義的原罪,這個錯誤在平均主義年代之初就出現了,就是凱特勒對於蘇格蘭士兵平均身材的解釋。凱特勒宣稱,他所測量出來的平均胸圍實際上代表著「真正的」蘇格蘭士兵的胸圍,並用「角鬥士的雕像」對此進行解釋,那時,他正是首次運用了遍歷性轉向。遍歷性轉向使他相信平均標準人的存在,更重要的是,遍歷性轉向還被用於證明他的假設——平均標準代表理想狀態,個體則代表錯誤狀態。

應用科學在一個半世紀裡都以凱特勒最初的錯誤概念為基礎。[13] 這就是為什麼會出現諾瑪雕像的尺寸沒有哪個女人能符合,大腦模型匹配不了任何人的大腦,標準藥物治療法不以任何人為治療對象,金融信用政策在處罰有信用的人,高校入學政策篩掉前途無量的學生,以及招聘政策忽視傑出人才等現象。

2004年,彼得·莫勒納爾在題為《心理學作為個例科學的聲明:回歸科學心理學,直到永遠》(A Manifesto on Psychology as Idiographic Science:Bringing the Person Back into Scientific Psychology,This Time Forever)的文章中,清楚地闡釋了遍歷性轉向用於個體研究的後果。[14] 他把科學職業生涯都奉獻給了平均主義,如今卻宣稱,平均主義錯得不可救藥。

「我猜你可能會說我像《聖經》裡的保羅,」莫勒納爾笑著對我說,「起初,我迫害基督徒,他們就是所有認為平均主義錯誤而個性才正確的同事。然後,我得到神啟,自己就走到了『通往大馬士革的路上』。如今,一旦提到個人的福音書時,我就是他們最大的勸導者。」

個體科學

僅僅把福音書帶給異教徒,並不意味著他們會聽你的。我問莫勒納爾,人們最初聽到他的觀點時如何反應,他回答道:「與大多數試圖替代或只是輕微修正一下固有觀念的努力一樣,人們對這些論點常常置若罔聞。更為激進的努力也都是徒勞的。」[15]

在發表了他的個性宣言後不久,莫勒納爾在一所大學裡做了有關宣言詳情的演講,號召人們摒棄平均主義。一位心理學家以搖頭來回應,並公然宣稱:「你在製造混亂!」[16] 每當莫勒納爾指出平均主義核心存在不可調和的錯誤時,心理測量學家和社會科學家就會產生這種情緒反應。沒有人懷疑莫勒納爾的數學運算。事實上公平地說,許多科學家和教育者的職業生涯都受到遍歷性轉向的影響,但是他們並沒有接受遍歷性理論的所有細節。但是,即使那些懂得數學且認可莫勒納爾結論的人,也表達了同樣的擔心:如果不用平均標準來進行評估、制定模型和挑選個體,那麼……能用什麼方法呢?

現實中的反對聲凸顯出了平均主義為什麼持續時間會如此之長,扎根社會能如此之深,同時,企業、高校、政府和軍隊對它的接受度如此之高的原因:因為平均主義比其他方法都更好用。畢竟,分類、排名以及平均標準運用起來十分方便。人們不用花多少精力就可以說,「她比普通人更聰明」,或者「他在畢業班裡排名第二」,或者「她性格內向」。這類簡明扼要的陳述句聽上去很真實,因為它們似乎都是以簡單明瞭的數學運算為基礎的。這就是為什麼平均主義對工業時代來說是完美的哲學。在那個年代裡,不論是企業還是學校的管理者,都需要一種行之有效的方法來篩選大量的人員,並在標準化分階層的系統裡,為他們找到合適的位置。平均標準為人們迅速做決定提供了穩定、透明、合理的方法。即使高校行政人員和人力資源管理者口頭上承認,對學生和員工排名存在問題,然而沒有哪個管理者會因為拿個人與平均水平相比較而丟掉工作。

同事對自己提出的個性宣言心存疑慮是有道理的:如果不能用平均主義,那應該用什麼方法呢?在聽到同事的反應後,莫勒納爾意識到,用複雜的數學運算來證明平均主義是錯誤的,這還不夠。如果他真的想徹底地推翻平均主義的暴政,就必須找出平均主義的替代物——某種比排名和分類更行之有效的理解個體的方法。

莫勒納爾找到他的上司、阿姆斯特丹大學研究生學院的院長,激動地告訴她,自己打算開發評價和研究個體的方法,構建新的科學體系。他列出了幾個新項目,包括召開有關個性的國際學術會議,希望她能資助這些項目。

「你知道,我不能再給你新的資源了,」院長無可奈何地拒絕了他,「你還有三年就要退休了。我很遺憾,彼得,你知道我們系統的規則,我無能為力。」[17]

突然間,莫勒納爾不得不反觀自己。在60歲這一年,他發現自己可以為科學做出巨大貢獻,這很有可能會改變社會的基本結構。然而,掀起革命是年輕人的遊戲,而荷蘭高校教育系統不會為他的宏偉壯志提供任何支持。他問自己,他是否真的願意為此一戰?

莫勒納爾曾想過聽天由命——畢竟,他的職業生涯非常成功,而且現在已快到結束的時候了。即使他決定引領改變科學遊戲規則的運動,也需要潛心鑽研多年,還要與科學家和社會機構做無數次鬥爭。然而,他並未做過多考慮。莫勒納爾告訴我:「當認識到當務之急是什麼,將對社會產生多大的影響,我就必須盡力尋求答案。」[18]

為了實現創造平均主義替代品的夢想,他開始在阿姆斯特丹大學之外尋找機會。2005年,機會來了。在大西洋的對岸,賓夕法尼亞州州立大學(Pennsylvania State University)為他提供了終身教授的職位,不久,又任命他為社會科學研究院定量發展系統方法論(Quantitative Developmental Systems Methodology)中心的創始主任。他根據自己的意願組建研究團隊,從世界各地招募了一群持相同觀點的頂尖科學家和研究生。他們聚集在賓夕法尼亞州州立大學,聚集在莫勒納爾的身邊。很快,他們就親切地稱莫勒納爾為「大師」。他們齊心協力,為尋找具有可操作性的平均主義替代品——關於個體的交叉學科——打下了堅實的基礎。

讓我們回顧一下平均主義年代的兩個最典型的假設前提。一個是凱特勒的論點:平均標準就是理想狀態,個體即是錯誤;一個是高爾頓的論點:如果一個人在某個方面表現優秀,那麼他很可能在其他方面都很優秀。與之相反,這門個體科學的主要假設前提是:個性很重要[19] ;個體不是錯誤;許多最重要的人文素質(如天資、智力、品格和性格)不能被簡化為一個分數。

在新的假設前提的基礎上,莫勒納爾和他的同事們開始研發新的工具,幫助科學家、醫生、教育者和企業家改進評價個人的方法。這些工具使用的數學運算方法與平均主義者所使用的完全不同。平均主義的數學運算被稱為統計學,因為這是基於靜態值的數學運算——穩定不變的固定值。但是莫勒納爾和他的同事認為,為了準確地瞭解個人,就應該使用一種截然不同的數學運算方法,如動態系統——基於變化的、非線性的動態值的數學運算。[20]

既然個體科學的假設前提和數學運算方法與平均主義的截然不同,那麼毫無意外,個體科學首先將矛頭對準了研究個體的方法。

先分析,後集合

平均主義最主要的研究方法是「先集合,後分析」:首先,將許多人聚集起來,找出這個群體的模式;再運用這些群體模式(比如求平均值或其他數據)來對個體進行分析和建模。[21] 與之相反的是,個體科學要求科學家「先分析,後集合」:首先,找到每一個個體的內部模式,再用合適的方式將個體模式集合起來,進行群體觀察。有一個發展心理學的例子說明了如何運用「個體第一位」的方法來研究人,從而推翻早已存在的對人類天性的論斷。

從20世紀30年代至80年代,研究嬰兒發育的科學家們一直在努力解決一個叫作「踏步反射」(Stepping Reflex)的謎團。當新生兒被直立抱著的時候,他的腿就會上下移動,就像在走路似的。長期以來,科學家們認為這種踏步反射證明了人的行走本能。然而,這種反射行為之所以如此神秘,是因為當嬰兒長到2個月左右的時候,這種反射現象就會消失。當你抱起大月齡的孩子,他的腿多半會保持不動。但隨後,就在嬰兒開始走路之前不久,踏步反射又會奇跡般地再次出現。是什麼原因導致這種反射現象的出現、消失和再次出現呢?

科學家首先試圖用傳統的平均主義方法來解開踏步反射的奧秘,也就是先集合,後分析。所有人都推測踏步反射與神經系統的發育相關,於是科學家們檢查了大量的嬰兒,計算出踏步反射出現和消失的平均年齡,然後將這些平均年齡與神經系統發育的重要階段相比較。他們發現有一個神經發育階段看起來與踏步反射的出現和消失相關:髓鞘的形成,即神經系統長出保護層的生理過程。因此,科學家提出了「髓鞘化理論」:每個嬰兒天生就有踏步反射,但是作為控制馬達的大腦開始出現髓鞘時,該反射現象就會消失。然後,當大腦的控制中心進一步發育後,嬰兒便重新獲得了有意識的反射控制。[22]

到了20世紀60年代初,髓鞘化理論成為踏步反射的標準醫學解釋,它甚至成為神經疾病的診斷依據:如果一個嬰兒的踏步反射沒有按時消失,醫生和神經學家就會警告家長,他們的孩子可能患有某種神經殘疾。[23] 許多兒科學家和兒童心理學家斷言,父母鼓勵孩子做踏步反射並不可取,認為這樣做可能會耽誤正常的發育,引起神經肌肉異常。

雖然髓鞘化理論難以理解也不好操作,但是它卻在後來幾十年的時間裡佔據了美國幼兒科學的統治地位。如果不是一位年輕的生物學家埃瑟·泰倫(Ester Thelen)[24] ,這種理論甚至可能會一直延續到21世紀。泰倫在職業生涯早期研究的是動物,她發現許多生物學家對動物的本能行為的研究方式僵化死板,而事實上,這些行為都存在很大的變數,很大程度上取決於每個動物個體的獨特習慣。這些格式化的專業經驗促使她去學習動態數學,最終她決定重新研究人類的踏步反射,並將研究重點放在每一個孩子身上。

泰倫歷時兩年研究了40個嬰兒。她每天都會給每一個寶寶照相,檢查他們的身體發育情況。她把他們抱在跑步機上,把他們放在不同的位置來分析每一個寶寶的各項運動機能。最終,她提出了新的假設:導致踏步反射消失的原因是胖乎乎的大腿。

她注意到,體重增長較慢的嬰兒,蹬腿動作會更多且持續時間更長;體重增加較快的嬰兒往往較早就失去了踏步反射,這只是因為他們的腿部肌肉沒有強壯到足以支撐起腿部。這並不是說,大腿肥胖程度是關鍵原因,事實上,身體發育的速度才是關鍵,真正重要的是體脂成分與肌肉強度的關係。[25] 這就是為什麼以前的科學家只是簡單地比較了平均年齡和平均體重,卻沒有任何發現。先集合、後分析的方法掩蓋了每一個孩子的獨特發育模式。泰倫運用先分析、後集合的方法,最終找到了原因。

不用說,對於踏步反射的許多科學解釋中,從來就沒有出現過「胖乎乎的大腿」,因此才會有那麼多的科學家立即否定了這個觀點。但是,泰倫設計了一系列巧妙的實驗,證明了大腿肥胖理由的正確性是毋庸置疑的。她把嬰兒放進水裡,接著,踏步反射再次出現了,即使大腿最胖的嬰兒也再次踏步了。她還給嬰兒的腿部增加不同的重量,並準確地預測出了哪些嬰兒會失去踏步反射。[26]

泰倫的研究對象是每一個嬰兒個體,她規避掉平均主義研究者所謂的嬰兒大腦可能存在問題的這種說法,並給出了解釋,她告訴家長,他們真正應該關心的是嬰兒的大腿是不是不結實。

在賓夕法尼亞州州立大學裡,彼得·莫勒納爾和他的中心已經證明了很多相似的發現,用「個人第一位」的研究方法得出的結果,優於僅依靠計算群體平均值的研究方法。但是有一個難題擺在「個人第一位」方法的面前,即它需要大量的數據,比平均主義方法所需的數據多得多。在研究人類的大多數領域裡,在100年前、50年前,甚至25年前,我們都不具備有效的工具來獲取並處理「先分析,後集合」所需的龐大數據。在工業時代,平均主義方法是當時技術發展的最高水平,而「個人第一位」的方法往往只是幻想。然而,如今我們生活在數字時代,在過去的10年中,獲取、存儲和處理海量個體數據的能力已經變得非常方便,而且十分普及了。

現在唯一缺少的,就是運用它的心態。

個性很重要

當吉爾伯特·S.丹尼爾斯中尉第一次提出飛機駕駛艙需要適應每一個飛行員,而非標準飛行員時,這似乎是不可能完成的任務。如今,那些曾經表示無法完成任務的企業,正將可調節的飛機駕駛艙作為賣點。[27] 同樣,埃瑟·泰倫決定通過研究嬰兒的個性特徵,挑戰根深蒂固的髓鞘化理論,似乎非常困難,甚至可能毫無意義。但是,她並沒有花多長時間就注意到了胖乎乎的大腿所發揮的作用。

平均主義限制我們思想的程度難以想像——我們自身基本上不會意識到,因為我們得出的觀點似乎都不言而喻且非常合理。我們的世界鼓勵——不,是要求——我們將自己與一大堆平均數進行比較,並為此提供了無數的理由。我們要將自己的工資與平均工資做比較,以便判斷事業成功與否;我們要將自己的結婚年齡與平均結婚年齡相比較,以便判斷自己是否結婚太早或太晚。但是,一旦你從平均主義思維中解放出來,那些以前看起來不可能的事都會變得直觀,然後變得明朗。

對莫勒納爾說「你在製造混亂」的那位心理學家,人們很容易對其表示同情。要想放棄平均主義似乎並不容易,這需要勇敢地走出已知世界。當你周圍的整個世界都穩穩地停留在平均主義的土地上時,這個建議就顯得格外魯莽了。但我們沒有必要在黑暗中繼續盲目地摸索。在本書的第二部分裡,我將分享有關個體科學的三個原則,即鋸齒原則、情境原則(範圍原則)以及途徑原則,並將取代你長久以來依賴的平均主義。這三個原則將幫助你運用全新的方式來評價、選擇和瞭解個人;幫你摒棄分類和排名,發現自己生命中真正的個性模式;並將幫助你徹底地消除平均主義不可挑戰的權威性。