讀古今文學網 > 大數據 > 尾聲 挑戰中國:摘下「差不多先生」的文化標籤 >

尾聲 挑戰中國:摘下「差不多先生」的文化標籤

而最大的毛病,則是西歐和日本都已以商業組織的精神一切按實情主持國政的時候,中國仍然是億萬軍民不能在數目字上管理。……一旦某一個國家能在數目字上管理,到底使用何種數字,尚可以隨時商酌,大體上以技術上的要求作主,不必籠統的以意識形態為依歸了。01

——黃仁宇(1918-2000),美籍華裔歷史學家,1991年

在論述完大數據時代的趨勢以及這個時代給個人、企業和社會帶來的諸多挑戰之後,本書應該可以畫上句號了。但在結束之前,作為一名中國人,還是按捺不住,要絮叨幾句我們中國在這個大時代當中所處的位置。

數據表明,今天的中國,是一個人口大國、互聯網大國、手機大國,但卻恰恰還不是一個數據大國。2011年,麥肯錫公司以2010年度各國新增的存儲器為基準,對全世界大數據的分佈作了一個研究和統計,中國2010年新增的數據量約為250拍,不及日本的400拍、歐洲的2000拍,和美國的3500拍相比,更是連十分之一都不到。

全世界大數據的分佈

說明:新數據的存儲量按年度新增的存儲器容量估算。02(數據來源:IDC Storage Report;Mckinsey Global Insititute Analysis)

和美國相比,中國擁有數據量的絕對值較小,這在情理當中。本書第三章曾談到,美國的聯邦政府,是一個數據帝國,它的數據主要有三個來源,一是業務管理的數據,二是民意社情的數據,三是物理環境的數據。這三種數據的積累,並不是一蹴而就的,在其漫長的發展過程中,有其重要的里程碑,例如1940年羅斯福引進的民意調查、1962年啟動的海浪監測計劃和1973年誕生的最小數據集。

而中國類似進步的取得,都是進入21世紀之後才發生的事情。2003年,中國開始著手制定醫療系統的最小數據集,3年之後,中國衛生部出台了第一版中國醫院最小數據集的標準。也是在2003年,中國創立了第一個全國性的大型社會調查項目,開始對社會的發展和變遷進行全方位、綜合性、縱貫性的問卷訪談調查。這個調查叫做「中國綜合社會調查」,是由中國人民大學發起的,中國人民大學隨後還按照國際標準成立了「中國社會調查開放數據庫」,向全社會開放調查的結果和數據。2006年9月,在幾經周折之後,國家統計局正式成立了社情民意調查中心,這是中央政府第一個、也是目前唯一一個專司社情民意調查的單位;至於對物理環境數據的採集,更是2010年前後才見到若干零星的報道。03

因此,從歷史發展的角度來看,中國擁有的數據量較小,可以理解;但另一方面,立足現實,中國的人口、互聯網的用戶、手機的持有量都位居全世界第一,2010年全年新增的數據量卻尚不及美國的十分之一,也大大出人意料。

2011年,中國擁有4.8億的互聯網用戶,幾乎是美國的兩倍;擁有近9億部手機,是美國的3倍。互聯網和手機,都是產生數據的重要來源。在中國,存儲器的價格也已經和國際接軌、相對便宜。在認真考察了這些因素之後,就不難發現,中國缺乏的不是可供收集的數據,也不是收集數據的手段,而是收集數據的意識。

中美兩國政府關於收集三種主要數據的對比

全世界互聯網用戶最多的10個國家

說明:從2000年到2011年,中國互聯網的用戶數增長了20多倍,已經雄居世界第一。(數據來源:Internet World Statistics,Miniwatts Marketing Group)

全世界手機使用量最多的10個國家

(數據來源:維基百科List of countries by number of mobile phones in use條目)

手機數據的應用:下一波數據創新的中心

手機是大數據時代海量數據的一個重要來源。普通手機定位(Mobile phone tracking)、基於智能手機的地理位置服務(Location Based Services)將成為下一波數據創新的核心應用之一。原因在於,手機和用戶如影隨形,可以記錄一個人的地理位置,這意味著無數的商機。例如:

·通過手機為駕駛人員提供智能導航、避開交通擁堵·通過手機支付高速公路的過路費

·通過手機追蹤人員和車輛的旅行安全、提供緊急救助

·通過手機在社交網絡中實時播報用戶的地理位置,與朋友和商家共享

·保險公司可通過分析手機用戶地理位置的變化和行為特點,制訂車輛保險費的收取方案。著名的咨詢公司埃森哲正在開發策劃一個新的項目以量化高速公路上廣告牌的效果,其核心手段就是分析手機數據。通過手機產生的地理位置數據,可以計算每天有多少行人經過某個特定的廣告牌、從什麼方位經過、什麼時候經過,行人中有多少當地的、又有多少外地的等等。通過這些數據,確定廣告的效果,為不同用戶找到最佳的廣告地點和時間。

大數據時代的這些新應用和新的商業模式將影響改變全球每一個人的生活。

中國人數據意識的淡薄,由來已久,甚至可以稱之為國民性的一部分。

19世紀中葉,中國的大門被西方的堅船利炮打開。由於科學落後、文化封閉,此後的百多年來,中國人飽受屈辱。在落後、挨打的痛苦掙扎中,中國人開始慢慢睜眼看世界,反省自己與西方的差距,在這個過程當中,也有思想先賢對國民「數據意識」方面的問題進行反省、批判和鞭笞。

中國近現代著名的思想家胡適就對中國人「凡事差不多、凡事只講大致如此」的習慣和作風深感憂慮。1919年,他寫下著名的《差不多先生傳》,活靈活現地白描了中國人取道中庸、不肯認真、甘於糊塗、拒絕精準的庸碌形象:

你知道中國最有名的人是誰?

提起此人,人人皆曉,處處聞名。他姓差,名不多,是各省各縣各村人氏。你一定見過他,一定聽過別人談起他。差不多先生的名字天天掛在大家的口頭,因為他是中國全國人的代表。

差不多先生的相貌和你和我都差不多。他有一雙眼睛,但看的不很清楚;有兩隻耳朵,但聽的不很分明;有鼻子和嘴,但他對於氣味和口味都不很講究。他的腦子也不小,但他的記性卻不很精明,他的思想也不很細密。

他常常說:「凡事只要差不多,就好了。何必太精明呢?」

……

後來他在一個錢鋪裡做夥計;他也會寫,也會算,只是總不會精細。十字常常寫成千字,千字常常寫成十字。掌櫃的生氣了,常常罵他。他只是笑嘻嘻地賠小心道:「千字比十字只多一小撇,不是差不多嗎?」

有一天,他為了一件要緊的事,要搭火車到上海去。他從從容容地走到火車站,遲了兩分鐘,火車已開走了。他白瞪著眼,望著遠遠的火車上的煤煙,搖搖頭道:「只好明天再走了,今天走同明天走,也還差不多。可是火車公司未免太認真了。八點三十分開,同八點三十二分開,不是差不多嗎?」他一面說,一面慢慢地走回家,心裡總不明白為什麼火車不肯等他兩分鐘。

……

他死後,大家都很稱讚差不多先生樣樣事情看得破,想得通;大家都說他一生不肯認真,不肯算賬,不肯計較,真是一位有德行的人。於是大家給他取個死後的法號,叫他做圓通大師。

他的名譽越傳越遠,越久越大。無數無數的人都學他的榜樣。於是人人都成了一個差不多先生。——然而中國從此就成為一個懶人國了。

黃仁宇,是著名的華人歷史學家,他參加過抗日戰爭,後來在美國學習、研究、深造,成為學貫中西的一代大家。他在晚年時發表了一系列的著作探討中西方社會的異同。他認為:

「資本主義社會,是一種現代化的社會,它能夠將整個的社會以數目字管理(Mathematically Management)。」

數目字管理,即以事實為基礎、以數據為核心的精確管理。

黃仁宇總結說:「中國過去百多年來的動亂,並不是所謂道德不良,人心不古,也不是全部軍人專橫,政客搗亂,人民流離」,而是因為中國未能像西方那樣實行「數目字管理」的現代治國手段。他還認為:「一旦某個國家能在數目字上管理,到底使用何種數字,尚可以隨時商酌,大體上以技術上的要求作主,不必籠統的以意識形態為依歸了。」

一句話:中國的落後,根源之一正是缺乏以數據為基礎的精確管理;而未來中國的進步,也有賴於建立這種精確的管理體系。

除了中國人自己思想家的反省和批評,西方世界對我們中國人漠視數據的特點也洞若觀火。

阿瑟·史密斯(Arthur Smith)是一位美國的傳教士,他於1872年來到中國,在中國的普通社區生活了54年,隨後著書立說,成為名動一時的中國文化研究專家。1894年,史密斯出版了《中國人的性格》一書04,該書在中國社會、國際社區都產生過很大的影響,一度被公認為研究中國人最權威、最詳盡的著作之一,被翻譯成很多個國家的文字。

史密斯認為,中國人,是一個「漠視精確、思維含混」的民族,他在書中寫道:

「中國人完全能夠像其他民族一樣學會對一切事物都非常精確——甚至更加精確,因為他們有無限的耐心——但我們必須指出的是,他們目前還不重視精確,他們還不知道精確是什麼。如果這一看法是正確的,那麼就可以有兩條推論:其一,在我們考查中國歷史檔案時,必須考慮到中國人漠視精確這一特性。我們採用中國人所提供的數字和數量很容易使我們自己受騙,因為他們從來就不想精確。其二,對於中國人所提供的冠以『統計數字』以抬高其權威性的各種材料,必須留有很大的餘地。」(《中國人的性格·漠視精確》)

作為一名留學生,長期在美國學習、工作和生活,我也深感到,和美國人相比,中國人確實缺乏「用數據來說話」的素養。中國的語言表達方式中「重定性、輕定量」的特點非常明顯,口語中經常使用「大概」、「差不多」、「少許」、「若干」、「一些」等等高度模糊的詞語。我身邊的一位攻讀博士學位的朋友,曾經給一位美國教授提供過一份中國菜的烹調方法,但其中關於「鹽少許」、「酒若干」、「醋一勺」的提法,令這位美國教授抓耳撓腮、不知所措。我事後自問,也確實感到這種提法,完全是跟著感覺走,讓人無從下手。此外,和美國數據資源的豐富、開放相比,不少中國留學生對於國內的數據匱乏有切膚之痛。寫論文、做研究,如果能選一個自己熟悉的中國話題,於國於己,都更有意義。可選的話題不少,但常常因為一數難求,多數選題都逃不出夭折的命運!有些數據國內確實沒有,有待收集;還有些數據水分太大,經不起推敲和檢驗;再有的,被有關部門貼上了「機密」的標籤,平民百姓無緣相見。

黃仁宇還對中國人缺乏「數據精神」的根源做了剖析,他認為:在中國傳統的學問——理學或道學當中,一直都分不清倫理之「理」與物理之「理」的區別。這兩個「理」混沌不分的結果,是中國人傾向於粗略的主觀定性、排斥精確的客觀定量,從而養成了重形象、重概括、輕邏輯、輕數據的文化習慣。這種文化習慣,使中國人長期沉浸在含蓄、模糊的審美意識當中,凡事只能在美術化的角度來印證,滿足於基於相似的「模糊聯想」,止步於用邏輯來分析、用數據來證明,最終將表象上的相似,當做本質上的相同。

但歐洲在中世紀之後,就將「倫理之理」與「物理之理」這兩個「理」劃分得很清楚了。

黃仁宇的看法,並不是一家之言。現代著名思想家漢娜·阿倫特(Hannah Arendt)也曾經對比過中國人和西方人在思維方法上的不同。她的結論是:西方人是「詞語思維」,中國人則是「形象思維」,而形象思維不是一種基於邏輯的推理性思維。05

歸根到底,中國人對數據的漠視,緣於一種文化上的缺欠:隨意、盲目、不求甚解、理性不足。

因為這種文化上的不足,科學最終在西方國家起源,當然不足為奇,中國人100多年來只能跟在別人身後亦步亦趨,也是應得的命運。

除了數據的收集和使用,中國在大數據時代需要面對的挑戰,還有數據的開放。

如果說收集數據是一種意識,使用數據是一種文化、一種習慣,那是否開放數據則是一種態度。

正如本書前文所描述的,互聯網上的數據開放,其開放的對象不僅僅是一個國家的人民,而是全世界的人民。這種開放,是無法阻擋的。中國人,只要願意,就可以登陸其他國家的開放網站,下載他們的公共數據,分析他們的財政開支細目,考察他們的房屋交易價格,甚至參與他們對公共事務、社會事務的批評和監督。即使作為外國人,在這個全球化的時代,中國人也可以感受到數據開放給全人類帶來的種種便利和實惠。而這些便利和實惠,正在成為信息時代世界各國一項基本的公民權利。

由於互聯網的發明,「開放」已經成為人類社會一個不可逆轉、不斷加速的社會思潮。如雨果所說:你可以阻擋一支入侵的軍隊,但你無法阻擋一種思想。在這個浩浩蕩蕩、不斷前進的世界大潮當中,我們將發現,中國如果不跟上,我們的處境將會越來越微妙、越來越尷尬、越來越孤立。

收集數據、使用數據、開放數據,都是大數據時代我們中國人需要一一面對的挑戰。

這三大挑戰,沒有一個不是任重道遠。但這些挑戰,也是我們在大數據時代徹底摘掉「差不多先生」文化標籤的重大歷史機遇。如果在這個數據意義凸顯的時代,我們還抓不住這些歷史機遇,繼續漠視數據、拒絕精準、故步自封,等待我們的,還將是一個落後的100年。

註釋

01 本引語共分兩部分,分散於作者所著的《赫遜河畔談中國歷史》(三聯書店,1992年)一書的正文和「大陸版卷後瑣語」。

02 具體估算方法請見麥肯錫全球研究所的報告Big data: The next frontier for innovation, competition and productivity,第103頁。

03 筆者沒有收集到中國政府在2010年前使用傳感器採集物理環境數據的實例,因此不作結論。

04 Chinese Characteristics, Arthur H. Smith, 1894

05 The Life of the Mind, Hannah Arendt (1906-1975), Edited by Mary McCarthy, 1978