讀古今文學網 > 萬萬沒想到:用理工科思維理解世界 > 第一百一十四章 數字左右社會科學 >

第一百一十四章 數字左右社會科學

本文繼續討論社會科學的全面數字化,研究一些更有意思的話題。

前文貼出以後,我注意到有相當的人認為統計方法只是社會科學研究的一種補充手段。也就是說,你可能先有了對事情因果的一個估計,然後用統計方法去證明你的理論。而今天社會科學的發展恰恰正在證明,這種認識是錯誤的。不是有了理論去找數字,而是數字提供理論。

一個最簡單的例子是預測紅酒的質量。買新產的紅酒堪稱是一種風險投資。

一瓶紅酒日久以後能不能好喝,能不能賣上好價錢,在它剛剛被釀造出來的時候誰也不知道。新產的紅酒,跟這瓶酒十年以後會是什麼味道,有什麼關係誰也說不 清楚,最資深的釀酒專家也不能給出恰當的預測。然而一個叫 Orley Ashenfelter 老兄,其本人根本不是釀酒專家,發明了一個通過葡萄生長環境的降水量和溫度預測未來紅酒價格的公式:

紅酒質量 = 12.145 + 0.0017×冬季降水量 + 0.0614×葡萄生長期平均溫度 – 0.00386×葡萄收穫期降水量

學物理的人會馬上注意到這個公式連量綱都不對。紅酒專家會憤怒的發現公式裡面居然不包括酒的釀造方法,與具體的釀酒廠無關。

Ashenfelter 的做法是對法國兩個地區從1952年到1980年的數據進行統計分析,找到真正左右紅酒質量的因素。他可能輸入了一百個可能左右紅酒質量的隨機變量,統計 分析的結果卻是,只有冬季降水量,生長期溫度,和收穫期降水量這三個因素起到決定性的作用,其他的都可以忽略。

這個公式相當成 功。(根據這個公式,1989和1990這兩年產的法國紅酒質量是最好的,其中1990的更好。)可以想像傳統的專家會多麼反對這個公式,他甚至不知道怎 麼釀造紅酒,居然就能預測質量?Ashenfelter 飽受攻擊,但事實勝於雄辯,此事的結果是 Ashenfelter 於2006年開始辦了一本雜誌:Journal of Wine Economics.

傳統專家總是看不上統計方法,然而事 實證明,統計方法總是戰勝傳統專家。兩位 super crunchers,Andrew Martin 和 Kevin Quinn,宣稱他們可以根據幾個變量來預測最高法院的法官們的投票結果。賓大法律教授傳統專家 Ted Ruger 看不過去,雙方比賽。一方是統計方法,另一方是83人組成的法律專家團,預測題目是2002年的最高法院表決。比賽背後的深刻內涵是,法律到底是邏輯的, 還是只不過是經驗的?使用統計方法的」非專家」們通過分析628個歷史案例,給每個法官畫了 decision tree 流程圖!結果統計方法的預測成功率是75%,而專家團只有59.1%。

用統計方法得出的結論往往是非直覺的,往往與人們以往的信念相左,得到的結論常常很難讓人接受。

我們都記得《華氏911》這個紀錄片裡面 9/11當天,布什在Emma E. Booker小學」愚蠢地」聽課的情景吧。其實他當時正在視察一種極其高效但是極有爭議的教學方法:」Direct Instruction」 (DI)。這是被統計證明有效,卻難以被社會接受的另一個例子。

DI 教學要求教師按照固定劇本教課。老師說的每一句話,對學生的每一個指令,都在教學手冊上(甚至包括」Good morning class」這句)。其思想是把信息分為容易消化的小塊,然後教的時候要確保每個小塊信息都被學生吸收。每個學生每分鐘會被要求最多 response 十次。做法是節奏要快,而所有學生齊聲回答問題。每5到10個水平相近的學生一組,這樣如果老師發現某個學生跟不上,就可以單獨讓他回答。這是最極致的填 鴨式教育。顯然,這種教和學非常消耗體力。

DI 是1960年代被 Siegfried 「Zig」 Engelmann 發明的,他大概寫了1000本這樣的上課劇本。他拒絕了那些什麼」以孩子為中心」之類的主流教育思想,因為他的數據統計證據顯示,DI是最有效的方法。此 方法是1967年美國政府組織的一個研究怎樣更好的給窮孩子教育的大規模教育實驗的產物。在17種教學方法中,DI 脫穎而出:在閱讀,數學,拼寫和語言方面都是 DI 孩子分數第一,而且還是遙遙領先。而且在解決複雜問題,比如猜測新單詞的意思的能力方面,也是 DI 學生最強。甚至在自尊自信方面,DI 孩子也比」以孩子為中心」教學的孩子表現的好!而最新(1998,2006)的研究結果也證實 DI 的優勢。DI 對幫助成績差的學生,窮人學生,和少數民族學生特別有效。DI 對教師要求很低,普通老師都可以使用 DI 劇本教學生。

你可以想像這種教法是多麼的令人難以接受。長期以來我們不是都說要激發學生的創造力麼?不都說要創造友好的教學環境麼?事實上,教育界的人批評 DI,說它把老師變成機器人。老師們一開始都不喜歡 DI,有的甚至辭職,但是幾個月以後的教學成果會打動他們。DI方法至今也沒有真正得到廣泛的支持,仍然飽受爭議。

讓數字自己說話,才是真正的客觀研究。以XX思想,XX主義去套的社會研究,不是真正的科學。為什麼傳統專家比不上統計方法?這是因為人類專家被認知失誤和偏見所困擾。而不是因為人類專家不善於做算術:)

– 人類傾向於過分關注不尋常的事件。比如《Freakonomics》這本書指出,大多數人認為家裡有槍很危險,然而實際上是家裡的游泳池比手槍對孩子危險100倍。

– 我們還總是執著於錯誤的信念。當新的證據出現時,我們總是只樂於接受那些符合以前的信念的證據。

當然傳統專家的智慧不能完全被排除掉,這些智慧有助於我們去設計統計模型,比如說給哪些隨機變量。但是二者的地位需要明確:傳統智慧為模型服務,而不是模型為傳統智慧服務。

統計方法早就有了,但是直到今天才開始全面地從一個輔助工具反客為主,這主要歸功於今天的海量數據和計算能力。那麼現在既然擁有了這麼強大的武器,我們 的社會科學是否有什麼特別重要的進展和發現呢?我自己的感覺是,此時此刻是社會科學全面發展的黃金時期。行為經濟學,認知科學,實驗心理學,這些學科的進 步是神速的。可以說人從來沒有像現在這樣瞭解人。

在所有這些使用統計方法得出的研究成果中,我最感興趣的是」天才是怎麼煉成的」這個研究。過去幾年內,因為好幾個團隊使用統計方法的艱苦研究,這一領域獲得了非常顯著的進展。我最近正在研讀幾本書,之後可能會寫篇文章專門討論,也就是《天才訓練指南》的升級版。