讀古今文學網 > 萬萬沒想到:用理工科思維理解世界 > 第五十一章 有一種規律叫隨機 >

第五十一章 有一種規律叫隨機

一個受過高等教育的人如果想表現自己的科學素養,最簡單的辦法是鄙視「彩票分析學」。這門學問完全合法地出現在各種晚報,新浪,搜狐甚至是人民網上,認為彩票的中獎號碼跟股票一樣,存在「走勢」。它使用「雙色歷史號碼」,「餘數走勢」,「五行碼」等五花八門的數字曲線,使用「奇偶分析」,「跨度分析」,「大中小分析」,幫助彩民預測下一期中獎號碼。網上大多數討論彩票「規律」的文章,甚至包括一些「專家」接受記者的採訪,都信誓旦旦地認為彩票是有規律的。而任何一個學過概率統計的大學生都可以告訴彩民:彩票開獎是個隨機過程,所有號碼中獎的概率都是一樣的,這次的中獎號碼跟歷史號碼完全沒關係。

研究雙色球的餘數走勢無疑是個缺少科學素養的愚蠢行為。但事實是,即使是受過很好教育的人面對隨機事件也可能會犯類似的錯誤。這個錯誤就是試圖從本來沒有規律的事情中找到規律。

如果你曾經被河南人騙過,如果你恰好聽說自己的一個朋友也被河南人騙過,如果你進一步發現網上也有個人被河南人騙過,你是否會得出結論河南騙子多呢?如果去年有個清華畢業的碩士生被查出來抄襲,今年又有個清華教授被查出來抄襲,你是否會得出結論說清華縱容抄襲呢?

即使考慮到河南是個人口大省,而清華這樣的名校的媒體曝光率比較高,這兩個地方的壞消息似乎也比相同量級的省份或相同知名度的大學高了一點。所以結論難道不是明擺著的嗎?如果騙子是在中國各個人口大省隨機分佈的,如果抄襲者是在中國各個名牌大學隨機分佈的,那為什麼恰恰是河南和清華「脫穎而出」?

在下結論之前我們先考察1940年的倫敦大轟炸。當時倫敦在德軍V2導彈的攻擊下損失慘重,報紙公佈標記了所有受到轟炸地點的倫敦地圖之後,人們發現轟炸點的分佈很不均勻。有些地區反覆受到轟炸,而有些地區卻毫髮無損。對英國軍方來說這是一個非常恐怖的事情,因為這意味著V2導彈的精度比預想的要高得多,以至於德軍可以精確選擇轟炸目標。而倫敦居民則相信,那些沒有遭到轟炸的地區是德國間諜居住的地方,有些人甚至開始搬家。

然而事後證明V2是一個精度相當差的實驗性質的武器,與其說是導彈還不如說是大炮 — 德軍只能大概地把它打向倫敦,而根本無法精確控制落點。也就是說倫敦各地區受到的轟炸完全是隨機的。一直到1946年,有人從數學角度分析了轟炸數據,把整個可能受到轟炸的地區分為576個小塊,發現其中229塊沒有受到任何轟炸,而有8個小塊受到了4 次以上的轟炸。這些數據雖然不均勻,但完全符合隨機分佈。實際上科學家可以用計算機模擬的辦法得到更多「看上去很不隨機」的隨機結果。

問題的關鍵是隨機分佈不等於均勻分佈。人們往往認為如果是隨機的,那就應該是均勻的,殊不知這一點僅在樣本總數非常大的時候才有效。當初 iPod 最早推出「隨機播放」功能的時候,用戶發現有些歌曲會被重複播放,他們據此認為播放根本不隨機。蘋果公司只好放棄真正的隨機算法,用喬布斯本人的話說,就是改進以後的算法使播放「更不隨機以至於讓人感覺更隨機」。一旦出現不均勻,人們就會認為其中必有緣故,而事實卻是這可能只不過都是偶然的。

一個更直接的例子是所謂「生日悖論」。在獲得奧斯卡最佳男主角獎的73名演員之中,有六對演員的生日相同。考慮到一年有365天,這是一個相當不均勻的分佈,難道我們據此可以說這六個生日是演員出生的幸運日麼?實際上,哪怕一個班級只有23個人,其中有兩人生日相同的概率就超過50%。進一步如果這個班級有57人,那麼有超過99%的可能性會出現相同的生日。

從極少的幾個事例中發現規律這種思維在多數情況下都是有益的,其實是人的重要生存本能。當發現有兩個小學生吃了食堂的午飯就出現不適症狀之後,立即懷疑食堂的飯菜有問題絕對是明智的選擇。進化心理學可以很好的解釋為什麼人會有這種自發尋找規律的心理:那個親眼看到兩個同伴吃了一種奇異的蘑菇就倒下了,還去吃這種蘑菇的原始人,不可能是我們的祖先。但我們必須明白這個道理,有些看似很有規律的事情其實是隨機的。就算是一個投注站連續開出兩次大獎,也不能說明這是個幸運投注站,或者說有什麼陰謀。就算我們連續三天聽說關於河南人的壞消息,也不能下結論說河南騙子比別的省多。除非你有大規模的統計數字。