讀古今文學網 > 大數據 > 第三章 數據治國 >

第三章 數據治國

儘管信息時代的技術進步已經徹底改變了商業領域和體育運動領域的決策過程,但聯邦政府對這些新技術的應用還僅僅處在一個開始的階段。要實施「數據驅動的決策方法」(Data-Driven Decision Making),我們不僅要使用新的技術、還要改變目前的決策過程。

然而,一旦打破這些障礙,我們將從中獲益:政府將更有效率、更加開放、更加負責,引導政府前進的將是「基於實證的事實」,而不是「意識形態」,也不是利益集團在政府決策過程中施加的影響。

機遇就在眼前。我們現在需要具有遠見的政治領袖立刻抓住這個機遇。01

——丹尼爾·埃斯蒂,耶魯大學法學院教授,2007年4月

美國這個國家,雖然年輕,但相信數據、使用數據,卻有著深厚的傳統。數據被視為科學的度量、知識的來源;沒有數據,無論是學術研究,還是政策制定,都寸步難行。

愛德華·戴明(1900-1993)

在1947年之後開始加入日本的經濟重建工作,他在統計和質量管理方面的貢獻,被認為是日本創新、打造高質量產品的重要助推器,他因此被日本人視為對其經濟崛起作出重要貢獻的英雄。

1950年,日本科學家和工程師協會開始設立戴明獎;每年的頒獎典禮,國家電視台都現場直播,為年度盛事。圖為戴明獎獎牌。

愛德華·戴明(Edwards Deming)是享有世界聲譽的美國統計學家、管理學家,也是質量管理理論的奠基人。二戰結束後,他曾經旅居日本,幫助日本人開展戰後重建,為日本的經濟崛起立下了豐功偉績。他有一句名言說:

「我們信靠上帝。除了上帝,任何人都必須用數據來說話。」

這句話在美國流傳極廣。

「我們信靠上帝」源於美國國歌,印在貨幣上不說,還是美國的國家箴言(National Motto)。作為一個宗教大國,美國有90%至92%的人都聲稱相信上帝。02「除了上帝,任何人都必須用數據來說話」,這後半句把數據提到了和上帝相提並論的高度,這反映了美國人對於數據的無比推崇。

上帝,是極大、極高、極虛的神的化身;數據,是至小、至實、至真的邏輯單元。既信奉上帝,又推崇數據,這兩者貌似對立,但卻在美國大眾的價值觀中交融滲透,這也反映了美國人對於宗教和科學的複雜心情和矛盾態度。

可以想像,隨著大數據時代的不斷深入,美國人對於「上帝」的態度,可能會越來越糾結;而對「數據」,將會越來越「迷信」。

這種「迷信」,對聯邦政府而言,已經不僅僅停留在「用數據來說話」的層次上了。近年來,隨著大數據的迅猛增加,各個政府部門都在嘗試「用數據來決策」、「用數據來管理」、「用數據來創新」,在這個過程中,湧現了一大批既務實管用、又令人耳目一新的做法和應用。

循「數」管理:平安大道怎樣鋪

截至2010年,中國擁有7800萬機動車輛,大概相當於美國的三分之一。但根據中國警察部門的報告,2010年有7萬人死於交通事故,是美國的兩倍。真實的數據可能還要高很多。兩國的交通安全專家認為:美國的數據非常可靠,統計了每一宗死亡案例,但中國的地方警察部門普遍存在少報、瞞報的問題,只有一小部分交通死亡的數據最終進入了官方的報告。03

——《紐約時報》,2011年7月26日

美國是全世界第一個全面普及汽車的大國,一度被稱為「車輪上的國家」。

汽車,是19世紀末在歐洲發明的。但一進入20世紀,美國就開始在汽車領域領跑世界。這主要歸功於一個美國人:亨利·福特(Henry Ford)。

福特出生於一個農莊家庭,他的父親寄望於他繼承農場的事業,但他卻喜歡機械發明,15歲就自己裝配了一台內燃機。16歲的那年,福特離開了家鄉,去工廠學徒、打工,他最終如願以償,成了一名機械工程師。1896年,33歲的福特自己設計製造了第一輛汽車。

後來,他的車開得越來越快,他也在這條路上,走得越來越遠。

1903年,他創立了福特汽車公司。在接下來的25年內,其公司為美國生產了1500萬輛汽車。

福特對美國社會的傑出貢獻,不僅僅在於他是一個發明家、企業家,還在於他具有極強的社會責任感。他立志要讓汽車這個當時只有權貴人物才能享用的奢侈品走進普通家庭,率先在汽車製造領域引進了流水線裝配的大規模生產方式。他曾經說道:「我將為大眾生產汽車。但它的價格會很低,只要有一份像樣工資的人,都能買得起,在上帝開創的偉大空間裡,他和他的家庭能共享快樂的時光。」04

在這個理念的指導下,福特讓利、低價銷售他的產品。通過他的努力,汽車在美國變成了真正的「大眾消費品」。福特也被後世稱為「美國汽車之父」。

隨著汽車的普及,道路交通事故也隨之增多,成為一個突出的公共問題。從1960年到1965年,因交通事故而死亡的人數以每年近30%的速度增長;1966年,死亡人數首次突破了5萬,成為全美輿論的焦點。當時,專家估計,如果不採取有力的措施來扼制這個增長勢頭,死亡人數將在1975年達到10萬。

但這卻沒有成為現實。

接下來的幾年,死亡人數有升有降。到1972年,交通事故的死亡人數攀升到了54589人,達到了歷史的最高點。此後近40年,呈不斷下降的趨勢。2009年,死亡人數為33808人,創下了自1954年以來的最低水平。不僅絕對死亡數量大幅下降,相對值也降到歷史最低水平,每1億英里駕駛里程的死亡數為1.13人。

這個成績的取得極為不容易。

要知道,1966年,美國的人口數為1.96億,2009年,已經3.07億;1966年,美國僅有1.01億註冊駕駛員、0.94億機動車輛,2009年,駕駛員上升到2.1億,機動車量增加到2.46億,人口和車輛的數量、密度都成倍增長,車輛的使用頻率也大幅增加,但交通事故的死亡人數卻不升反降,而且幅度顯著:由5萬多人下降到3萬多人。

原因當然不是單方面的。

1966年和2009年的主要指標對比

1966年到2009年美國人口、機動車輛以及駕駛人員的增長

說明:這3條曲線表明,美國機動車輛的增長速度比人口的增長速度、駕駛人員的增長速度都快;1970年代,機動車輛的總數開始超過駕駛人員的總數。〔數據來源:美國高速公路管理局(FHA)〕

一方面,可以肯定,因為汽車技術的發展,汽車本身的安全性在不斷提高;但另一方面,交通事故的發生,很大程度上是人為原因造成的,死亡人數之所以能夠大幅下降,更重要的原因,在於政策的引導和管理。

美國的交通安全管理局(NHTSA)是交通事故的主管部門。回顧這幾十年的工作,該局將他們的經驗概括為:循「數」管理。

循「數」管理的方法,就起源於1966年。

1966年,由於交通事故死亡人數突破5萬人,民間一時輿論沸騰,美國國會迅速對此作出了回應,通過了《高速公路安全法》(Highway Safety Act),要求聯邦政府「立即建立一套有效的交通事故記錄系統,以分析確定交通事故及傷亡的原因」。05

這個法案的直接結果,是交通安全管理局開始在全國範圍內收集交通事故的死亡記錄,建立了「交通事故死亡分析報告系統」(Fatal Analysis Reporting System)。交通安全管理局也因此成為美國聯邦政府最早開始大規模收集數據的部門之一。經過幾十年的發展,該系統已經演變為一個在線分析系統,任何人都可以上網查詢。

以2009年為例,在該局的網頁上,你可以輕鬆找到以下數據,06僅僅做一些簡單的分析和對比,你就能發現,美國發生的交通事故確實有「規」可循:

2008、2009年致命交通事故按月對比

發現〔1〕:從兩年的數據看,夏季(5、6、7、8月)明顯是一年之中交通事故的高發期。

2009年致命交通事故按星期和時間對比

發現〔2〕:每天的18:00-21:00是交通事故的最高發時段,但可以看到,週六這個時段的事故發生量比工作日還多。這說明,不僅僅是因為上下班,即使休息,18:00-21:00這個時段也是人們駕車出行最活躍的時段。

發現〔3〕:單就一天來看,黑色星期六為「單天」死亡數之冠,其次是星期天、星期五。

發現〔4〕:如果僅僅從一周內的時段來看,星期天的午夜零點至3點,才是真正的致命時段,其次是星期六的同一時段。

2009年致命交通事故按時間段對比

發現〔5〕:午夜零點至3點這個時段發生事故的原因,有66%是酒後駕駛;在所有的時段當中,午夜酒後駕駛的比例是最高的。

發現〔6〕:單車駕駛產生的事故遠遠高出多車相撞的事故。

2009年致命交通事故按天氣和路況對比

發現〔7〕:惡劣天氣和光線條件並不是發生事故的必然原因,絕大部分事故都發生在正常天氣及光線較好的白天。

2009年因交通事故死亡人員的年齡結構

發現〔8〕:25歲到34歲的人群居交通事故死亡人數之首,其次是45歲至54歲的人口群。

2009年致命交通事故死亡人數按人員類別對比

發現〔9〕:行人總是交通事故的犧牲品,約占死亡人數的14.4%。

2009年因交通事故死亡的男女比例

2008年因交通事故死亡的男女比例

發現〔10〕:男女兩性因交通事故死亡的比例很穩定,為7:3。

以上的圖表和發現,都是僅僅基於一兩年數據之上的簡單加總、分析和對比。

可以想像,隨著數據的累積和增多,可以做的分析和對比也越來越多。一起交通事故的數據可能是無序的,一年的數據、一個地區的數據也看不出太多的章法,但隨著跨年度、跨地區的數據越來越多,群體的行為特點就會在數據上呈現出一種「秩序、關聯和穩定」,更多的規律將浮出水面。在幾十年的循「數」管理中,美國國家交通安全管理局有不少這樣的經驗和例子。

有一次,該局發現某個州發生車輛右側碰撞的比例每年都比其他州高,在認真調查之後,發現原因在於該州公路的路緣坡比其他州的都要長,這導致了駕駛員注意力的分散。又比如,1980年始,個別州開始實施駕駛人員必須佩戴安全帶的規定,但隨後收集到的數據卻表明,實施同樣規定的州,死亡率的下降幅度卻各不相同。這個數據之差引發了聯邦政府對全國的執行情況進行檢查和對比。後來發現,效果明顯的州,警察有權力隨時截停車輛、檢查司乘人員是否佩戴了安全帶,而效果不明顯的州,僅僅規定警察只能在以其他理由截停車輛時順便檢查車上的人員是否佩戴了安全帶。這個發現,後來引發了多個州執法方式的改變。這也說明,相同的政策,由於執行方式不同,效果可能大不相同。

近幾十年以來,交通安全管理局每年都組織各州的工作人員參加數據收集和分析的培訓。根據數據分析的結果,該局調整、制定新的政策,新政策實施以後,再收集新的數據,進入新一輪的效果評估,如此週而復始、循「數」漸進,從而確定最有效的措施、最好的做法,再在全國推廣。

除了數據收集和數據分析之外,該局的經驗表明,循「數」管理還有一個重要的環節:數據發佈。

交通安全管理局通過互聯網公開發佈其收集的數據。

如果認為網上的數據發佈僅僅是為了社會監督,那就大錯特錯了。監督僅僅只是其中一個目的。交通安全管理局在介紹他們循「數」管理的經驗時,特別強調了通過網絡發佈數據的重要意義。

在網上發佈數據,將會吸引一大批對這個問題感興趣的各界人士參與到政策制定的過程中來,足夠多的眼睛,將會使所有的問題都無所遁形,更多的問題將被發現,更多的細節將被討論,更好的方案將會被激發。還有,通過發佈這些數據,一項具體政策的執行效果能夠被量化,各個州之間很方便進行「事實對比」,新的政策如果有效,很容易在全國範圍內被接受、複製並推廣,形成一種良性的「政策競爭」氛圍。

交通安全管理局的循「數」管理三部曲

數據「驗」平權:民權史上的碑石

(但對黑人來說)僅僅自由是不夠的。你不能只對他們說:「現在你自由了,想去哪裡都可以,也可以做你想做的事,選擇你喜歡的領導人。」僅僅這樣做不可能抹去幾百年的創傷。一個多年來都戴著枷鎖蹣跚的人,你不能一解除他的桎梏,就把他帶到起跑線上,對他說:「你自由了,現在可以和其他人競爭了。」你還認為這是真正的公平。……我們追求的不僅僅是自由,還有機會……就此而言,機會平等才是根本。07

——林登·約翰遜,第36任美國總統

1965年6月4日在霍華德大學畢業禮上的演講

在美國,和政府做生意的公司有一個專門的名稱,叫政府合同商(Government Contractor)。政府合同商通過承接政府的項目,賺國家的錢。國家的錢,歸根結底就是納稅人的錢。為了保證納稅人的錢不僅花得有效率,而且還能夠促進社會公平,聯邦政府對這個過程制訂了諸多的規定。例如,對於50人以上的公司,只要獲得一筆大於5萬美元的政府合同,聯邦政府對其就執行有別於一般企業的要求。諸多要求中的重要一項,就是「平權措施計劃」(Affirmative Action Plan)。

平權措施計劃,是美國民權運動史上的里程碑。

該計劃規定:公司不得因為僱員的年齡、種族、膚色、原籍、性別、婚姻狀態、宗教信仰,以及是否殘疾、是否退伍軍人等事項對僱員產生歧視。其初衷在於保證所有人,特別是少數民族,都享有公平就業的機會,在每一個公司都營造一個和總體人口特徵一致的工作集體。

換一個角度來思考,「平權措施」其實並不「平」,因為其本質是通過人為的干預給予少數民族「優先」權,製造機會平等。比如說,一個公司要增加人手,即使前來應聘的白人要比黑人優秀,但因為法定的黑人比例,可能仍然要僱用黑人。

但很多人認為,只有通過這種平權措施,才能在現階段有效地幫助少數族裔,特別是縮小黑人與白人之間的差距。

「平權措施計劃」起源於1961年的肯尼迪時代,那時候的平權,主要集中在種族和膚色的問題上。1963年,肯尼迪遇刺,約翰遜繼位,這位和《信息自由法》過不去的總統,極力推行種族平等,將「平權措施」推向了頂峰。1967年,受女性解放運動的影響,他又將平權措施擴大到「性別」領域。近10年來,在美國,「性別平等」甚至有超過「種族平等」的趨勢,成為平權措施計劃中最受爭議的話題。

2001年,沃爾瑪公司150萬女僱員認為她們在公司的薪酬和晉陞中受到了普遍的歧視,從而提起了性別歧視的集體訴訟。該案原告人數之多,創下歷史之最。官司歷時10年,一直從聯邦地方法院、巡迴法院打到最高法院,「百萬娘子軍」曾兩度勝訴,但2011年6月,最高法院判決,原告缺乏特定的、直接的證據證明沃爾瑪存在普遍的性別歧視政策,不予支持。

「娘子軍」雖然最終敗訴了,但女性在職場的平等問題已經成為一把隨時都可能落下來的「達摩克利斯之劍」,作為聯邦政府的合同承包商,各大公司無不警醒、小心翼翼。

那麼,聯邦政府的勞工部是如何監督落實這些平權政策的呢?

每一年,每一個政府的合同商都要上交勞工部兩份報告,一是數據統計報告,二是文字敘述資料。數據統計報告中包括了全部員工的性別、種族以及收入變化等數據項,勞工部的工作人員對每個公司提交的數據進行分析,並和行業的總體情況進行對比,一旦發現潛在的歧視問題,例如女性職員的數量過少或薪酬過低,就會對相應的公司發出警告,限期改正,拒絕改正的公司將失去再次獲得合同的資格。文字敘述資料則包括公司的員工手冊、宣傳相關勞工法的海報、培訓制度、招聘制度以及相關職位招聘過程的記錄。

2010年,全美共有30多萬個政府合同商,由於上述這項規定,每年所產生的數據量,也不容小覷。基於原始數據的分析,當然也更加準確、公正、可靠。

政府合同商向聯邦政府提交的這些數據和信息,當然也屬於聯邦政府收集的業務信息。那麼,除了勞工部把它們用於分析監督「平權措施計劃」的實施情況之外,是否可以公開呢?換句話說,如果有第三方按照《信息自由法》對聯邦政府提出要求,要查閱某政府合同商為「平權措施計劃」提交的信息和資料時,聯邦政府是否可以公開這些資料呢?

這個問題曾經在美國歷史上「糾結」過,引起過很多宗法律糾紛。其中最著名的是「克萊斯勒訴布朗案」。08

1970年代,克萊斯勒公司(Chrysler Corp.)獲得了國防部的一項合同。作為政府合同商,該公司按規定向國防部提交了「平權措施計劃」規定的資料。1975年5月,一個工會組織向國防部提出信息查詢的申請,要求獲得克萊斯勒公司提交的數據和文件。國防部認為該要求符合《信息自由法》的規定,在知會克萊斯勒公司後,向該工會公開了這些數據和文件。

但克萊斯勒公司對此表示強烈的反對,他們認為這些信息屬於它的商業秘密,國防部無權向第三方公開。克萊斯勒隨即將當時的國防部部長布朗告上了聯邦地方法院,經過3年的折騰,1978年,官司最後上訴到最高法院。

1979年4月,最高法院宣佈克萊斯勒敗訴。最高法院認為,《信息自由法》的根本目的,是鼓勵政府機構的信息公開,商務機密雖然享有豁免權,但根據現有的法律,這種豁免權是許可性的,而非強制性的,既然是非強制性的,即使該信息屬於商業機密,政府部門有權不公開,也有權公開,即公開並不違法。

克萊斯勒訴布朗案是「平權措施計劃」及《信息自由法》的標誌性案件。此後,《信息自由法》也開始正式成為商業公司競爭的工具。不少公司,都通過這個渠道,向聯邦政府索要文件,以瞭解競爭對手的運營情況。據統計,2010年,有三分之一的信息公開的要求都來自商業公司。這當然又引起了美國社會的又一次討論,《信息自由法》的初衷,是保護公民的知情權,如今似乎已經「淪」為商業競爭的工具,這又是否合適呢?

數據「打」假:最大的爭議就是福利濫用

我們才剛剛開始全面利用數據挖掘的技術。我們相信,使用正確的技術,加上專業的人員,並保證數據安全,通過這三者的結合,數據挖掘將成為我們提高財務審計效率和效果的重要工具。09

——美國國會政府問責辦公室,關於數據挖掘在國會的聽證,2003年3月

歐洲大部分的發達國家都實現了全民醫療保險制度。

但對這種全民福利的做法,長期以來,美國社會並不認同。

不認同的原因主要有兩點:一是對政府的不信任;二是認為如果政府對公民大包大攬負全責,公民就會對自己不負責。

在這種態度的主導下,美國的福利制度,一直以來都是以具體的項目為依托、以特定的群體為目標來開展的。其中,兩個最大的醫療福利計劃是1965年通過的,也是第36任總統約翰遜促成的:

一是專門針對殘障人士和65歲以上老人的醫療保險計劃(Medicare);

二是以貧困人口為對象的醫療補助計劃(Medicaid)。

也就是說,老、弱、窮看病,政府買單。第一個醫療保險計劃是通過保險來支付,由聯邦醫療保險和補助中心(CMS)監管實施;第二個醫療補助計劃是政府直接支付,由聯邦政府CMS中心和各個州政府共同實施,分成支付。

根據CMS中心的統計,2009年,醫療保險計劃支出共5023億美元,覆蓋了4700萬的美國人口;醫療補助計劃共支出3739億美元,覆蓋了5680萬美國人口。10由於兩個計劃都是針對社會的弱勢人群,它們之間也互有交叉,例如,對於老年的貧困人口群,就可能同時適用兩個計劃。2009年,有850萬人同時受惠於兩個項目。

福利政策在全世界最大的爭議,就是福利濫用、最後養了懶人,導致社會發展缺乏動力。美國雖然慎之又慎,但這兩塊免費大蛋糕,也不例外。2008年,聯邦調查局在《財務犯罪年度公開報告》中估計,聯邦政府每年的醫療開支當中,大概有3%到10%涉嫌造假和欺詐。11面對利益,人類的創造力總是無窮的:虛假賬單、重複申報、無中生有,小病大治、慢治、長治,隱瞞收入和存款、裝窮吃低保,林林總總,不一而足。

兩個項目的受惠人群,加起來有近1億人,平均每人每月上一次醫院,一年就有12億張賬單,按照聯邦調查局的估計,大概會有3600萬到1.2億張賬單存在問題。如果要依靠人力去張張審查,其工作量是難以想像的。

目前,CMS中心最主要的措施,就是通過數據來打假。

2001年,加州州政府率先推出了一個數據挖掘的項目「保險補助雙向核對」(Medical-Medicaid Data Match),將醫療保險和醫療補助兩個項目的數據整合起來,利用兩個計劃中的人員、時間、價格、地點等數據信息對每一宗申報進行互相核實,通過計算機算法自動確定相互矛盾、有異於常態的支付記錄,一旦發現造假或者不實申報的可疑賬單,則轉入人工追討的環節。

這大大縮小了人工審查的範圍,提高了打假的效率。

由於效果顯著,2004年,這個項目在個別州的實施範圍進一步擴大,由事後追討推進到了事前防範。這意味著,CMS中心一收到申請報銷的賬單,就啟用數據挖掘系統對該申請的數據記錄進行「風險評分」:得分低於預定風險額度的申報則轉入自動支付的環節;得分超過該風險額度的申請將退回申請人,或提交專門的小組進行人工複審。

支付後的賬單,最後還要經過另一個數據挖掘算法的審核,發現可疑的,再轉入人工追討的環節。

以上措施的效果非常顯著,很快引起了美國國會的重視。大部分國會議員都相信,數據挖掘的做法將為國家節省開支。2005年,國會通過了《赤字削減法案》(Deficit Reduction Act of 2005),該法案的根本目的是「精簡機構、裁減開支」。在對大多數聯邦機構削減經費的情況下,國會卻給CMS中心下撥了專款,用於成立擴大專門的數據挖掘審查隊伍。衛生部甚至主張,這種數據打假的項目應該納入國家醫療信息系統基礎設施建設的範圍,換句話說,以後的醫療系統,在設計階段,就應該包括數據挖掘的打假功能。

說明:2010年10月6日,奧巴馬和Technology CEO Council的成員座談,商討如何利用高端的數據分析技術來削減開支。(圖片來源:www.techceocouncil.org)

數據挖掘還常常能給工作人員帶來一些意外的驚喜。例如,Neulasta是一種治療癌症的注射劑,2006年,CMS中心的算法發現,不同醫院提交的Neulasta賬單不一致,有的賬單使用毫克作為單位,有的賬單使用瓶作為單位,而一瓶為6毫克。經過調查證實,使用瓶的賬單屬於「有意或無意」的人為錯誤,但這個錯誤,把申報的開支擴大了6倍。僅該項發現,就為聯邦政府挽回了近50萬美元的損失。

2007年3月,CMS中心的首席財務官希爾(Timothy B. Hill)出席國會的聽證會,他例舉了數據挖掘項目實施一年多之後的效果:通過數據挖掘預設的風險評分門檻,確定了2500萬美元的虛假申報,事後的數據挖掘複審環節又追討了1500萬美元的超額申報;其中,有50多宗欺詐案浮出水面,最後移交司法部門處理。12

除了CMS中心,聯邦政府的社會福利項目都陸續開始採用數據打假的做法。2010年10月,為了削減赤字,奧巴馬在白宮和他的技術顧問委員會召開會議,IBM、DELL、Intel等大公司的CEO向他建議說,聯邦政府如果在社會福利的項目上加大數據挖掘、分析技術的應用,預計10年內可以再為國家節省2000億美元。

近十幾年來,除了福利打假,數據挖掘的技術在聯邦政府的其他部門也獲得了廣泛的應用。「9·11」以後,國家安全局更是依賴該項技術跟蹤確定恐怖分子,本書後續章節對這項技術及其應用還將有專門的介紹。

CompStat:街頭警察的創新傳奇

每一個人的心裡,都有理想主義的火花,它可以被燃成火焰,進而迸發出非凡的能量和結果。13

——路易斯·布蘭代斯(1856-1941),美國最高法院大法官

將數據分析大規模地引入到治安管理工作中的做法,起源於紐約。

紐約,是全世界的金融和商業中心,在美國的經濟和政治生活當中佔有舉足輕重的位置。

紐約市也是美國人口數量最多、密度最大、多元化程度最高的城市。它擁有810多萬人口,其中超過三分之一是非美國本土出生的外籍人員,這些人來自全世界不同的國家和族裔,使用100多種語言。

因為人口眾多,不免魚龍混雜,紐約也曾經是一個著名的犯罪之都。從上個世紀70年代起,黑幫橫行、毒品氾濫,該市的治安情況不斷惡化。1990年,紐約市共發生了兇殺案2245宗、車輛盜竊案147123宗,平均每天有6個人死於惡性犯罪,每小時有16台車輛不翼而飛。

1994年,紐約市的警察部門啟用了一個新的治安信息管理系統。這是一個以地圖為基礎的統計分析系統,隨著它的出現,紐約城的治安開始逐年好轉。這個叫做「CompStat」的系統也開始名揚全國,成了20世紀美國警務管理工作當中最為濃墨重彩的一筆。

CompStat,是COMPuter STATistics(計算機統計)的縮寫,現在已經演變成為一個專有名詞,特指一種警務管理模式。

這是一個傳奇故事,一個源於地鐵,發生在一位巡警、一位局長和一位市長之間的傳奇故事。

1970年,傑克·梅普爾(Jack Maple)剛剛高中畢業,他加入紐約市交通警察局成為一名地鐵線上的警察。當時,地鐵線上的搶劫案非常頻繁,地鐵警察,被認為是紐約最危險的工作之一。

為了追蹤搶劫案,梅普爾在時代廣場做過便衣,在中央車站指揮過攔截和抓捕。在十幾年街頭警察的經歷當中,他慢慢「悟道」:案件發生在哪裡警察就出現在哪裡,是讓罪犯牽著鼻子跑;要控制局面,抓到老鼠,警察一方必須掌握主動,做一隻有「預測能力」的貓。

於是,這位高中畢業生開始研究地鐵搶劫案的發生規律。

梅普爾在辦公室的牆上掛上了幾百幅地圖,用不同顏色的大頭針來跟蹤地鐵搶劫案發生的時間和地點,分析其中的原因和規律。無數個夜晚,他點著香煙,站在巨大的地圖面前,時而舉頭凝視,時而低頭徘徊,揣度琢磨第二天可能發生搶劫的時間和地點。在一陣苦思冥想之後,最後用大頭針按下的那個小點,就代表了他第二天的伏擊地點。

梅普爾後來晉陞為警督(相當於派出所所長),他就採用這種方法來部署和調配他所轄區的警力。他的辦公室掛滿了地圖,被同事戲稱為「地圖牆」,他卻稱之為「預測未來的圖表」(Charts of the Future)。

1990年,「預測未來的圖表」引起了新任局長佈雷特(William Bratton)的注意。佈雷特是位退伍軍人,他雷厲風行、慧眼識才,在認真研究了「地圖牆」之後,他認為梅普爾的方法很「靠譜」。於是開始在全局推廣梅普爾的圖表管理方法。

第二年,紐約市的地鐵搶劫案下降了27%。

但紐約的整體社會治安並沒有好轉,除了地鐵搶劫案,其他的案件都還居高不下。這更令佈雷特相信,「預測未來的圖表」確實行之有效。

1993年,治安持續惡化。這個問題,甚至成了紐約市市長競選當中最熱門的話題。

這個話題也成為共和黨候選人魯迪·朱利安尼(Rudy Giuliani)的政治機遇。

朱利安尼出生於紐約市的一個普通勞工家庭。他1968年法學院畢業之後,長期在司法部門工作。1983年,他晉陞為紐約市的聯邦檢察官。在他擔任這個職務的6年期間,朱利安尼先後將4000多名嫌疑犯送進了監獄,其中有不少都是轟動全國的黑道大哥、幫會首領。朱利安尼作為公訴人,多次受到黑社會的威脅,但他剛正不阿,始終秉法辦案,在新聞界獲得了「鐵面」的美譽。

作為共和黨的市長候選人,朱利安尼的主打牌就是「治安」。他在競選演講中介紹說,他的朋友在餐館等公共場合碰到他,都不敢和他打招呼,因為怕被黑社會盯上、莫名其妙受到報復。他在街上,也經常碰到一些刑滿釋放的人員,那些人對他做出鄙夷的表情,並當面嘲笑他說:「你沒人緣,選不上!」

朱利安尼卻呼籲說,如果紐約人民真正想改善治安,就不能讓他落選!因為他是改善治安最好的人選——別無其他!

他的演講,情理並茂,他的鐵面形象和誠懇的態度,最終打動了紐約人,得以高票當選。

一上任,朱利安尼就立即任命佈雷特為紐約市警察局局長。

而佈雷特到任的第二天,就任命梅普爾為第一副局長,並要求梅普爾立即組織開發一套電子版的「預測未來的圖表」。

「CompStat」於是誕生了。

1994年,互聯網還沒有普及。CompStat的工作人員每天通過電話和傳真向全紐約76個警區收集數據,再將數據統一錄入到CompStat,進行加總和分析。

每週二、週四的早晨7點,佈雷特就召集全部警區的指揮官開會。最新發生的案件以圓點的形式出現在各個轄區的地圖上,不同顏色代表著不同類型的犯罪,特定位置的成串圓點則表明那裡發生了一系列的案件。各個指揮官在這些「績效指示燈」前面依次陳述自己轄區的情況、對策以及警力的調配,一個回合下來,不少人滿頭大汗。

1980年代,傑克·梅普爾還是地鐵站的一名便衣。

他去世當天,紐約城幾乎所有的報紙都刊登了他的傳奇故事,評價他是「街頭警察的偉大發明家」、「真正的紐約英雄」、「熠熠生輝的普通人」。(圖片來源:Richmond Hill Historical Society)

為了保證CompStat的落實和推行,佈雷特一共撤換了近三分之二執行不力的指揮官,可謂「鐵腕」。

次年,紐約的犯罪率應聲而降。兇殺案從1994年的1561宗下降到1177宗,車輛盜竊案由95420宗下降到72679宗。此後,這些重要的指標不斷下降。2009年,兇殺案下降到466宗,創下了50年之最低。這個指標,已經使紐約躋身全美最安全的大城市行列。

當然,佈雷特在紐約推行的警務管理模式,其做法並不僅僅局限於「地圖和數據」。例如,他非常推崇「破窗理論」(Broken Windows Theory)。該理論認為,一個城市,如果對小的違法行為縱容姑息,不良現象就會被放任、模仿,逐漸擴大、蔓延為成片的犯罪行為。所以,即使對一個窗戶玻璃被砸破的投訴,接警中心也要認真記錄,並納入地圖上的數據分析。也就是說,地圖上的圓點不分案值大小、案情輕重,一律同等對待。

又例如,露宿公園、街頭的青年,常常是酗酒、賣淫和吸毒活動的參與者,佈雷特要求,不能僅僅是打擊、驅散,必須刨根問源:他們從哪裡來?面對什麼困難?需要什麼幫助?只有真正解決了這些問題,那些地圖上代表犯罪的「圓點」才能最終被消除,而不是從一個區域轉移到另一個區域、在地圖上「此」起「彼」伏。

2002年,佈雷特又擔任了洛杉磯的警察局局長。洛杉磯是美國僅次於紐約的第二大城市。在佈雷特任職的6年裡,洛杉磯的犯罪率每年都在下降。

朱利安尼因為政績突出,連任兩屆市長,並登上了《時代》雜誌的封面,成了全國知名的人物。2008年,他宣佈參選總統,民意調查表明,他是共和黨陣營內知名度最高的候選人。但後來由於離婚等個人原因,他最終退選。

梅普爾後來辭去了公職,創辦了一家咨詢公司,幫助全國各地的大小警局實施CompStat系統。2001年,他被確診為患有結腸癌。他留下遺言說,希望自己的靈車能在黃昏的時候,穿越時代廣場和中央車站。他說他知道這正是下班的人潮高峰,交通繁忙,但他希望再去那裡一次。多年來,他在那裡巡邏,確保交通順暢和治安不亂,這一次,他開玩笑說,要讓大家最後也等他一下。

朱利安尼出席了梅普爾的葬禮,他盛讚梅普爾是美國街頭警察中偉大的發明家,為紐約城成為美國最安全的大城市做出了歷史性的貢獻。

紐約的巨大成功,很快引起了其他地方政府和聯邦政府司法部的注意。90年代起,全美各地有近三分之一的治安管理部門都陸續複製引進了CompStat的管理模式。1993年,克林頓任命珍妮特·雷諾(Janet Reno)擔任司法部長。雷諾是美國歷史上第一位女司法部長,在她的任期內,她大力推行「數據驅動」的管理方法(Data-Driven Management),並不斷強調:

「數據和信息是執法工作當中制定戰略和決策的基礎。」14

1996年,CompStat獲得了哈佛大學的美國政府創新獎(Innovations in American Government Award)。此後,CompStat甚至進入了美國總統和副總統的視野。

1998年10月1日,副總統戈爾宣佈,司法部要會同全國政府改革合作委員會15成立專門的工作組,在全國的警務部門研究推廣「地圖映射和數據驅動的治安管理」(Crime Mapping and Data-Driven Management)。克林頓總統甚至在1999年的國情咨文中,也提到這種新的方法和系統。

隨著時間的推移,越來越多的事實和發現證明,這種方法不僅對治安管理行之有效,還可以推廣到其他領域,很多時候,還可以帶來出人意料的發現。

2006年,通過把20多年的犯罪數據和交通事故的數據整合到一起,並映射到同一張地圖上之後,警務研究人員驚奇地發現,交通事故的高發地帶,也正是犯罪活動的高發地帶,甚至交通事故的高發時間段,也是犯罪活動的高發時間段。

維護交通安全、打擊犯罪活動,這兩個職能本來分屬於不同的聯邦部門。基於這個新的發現,美國國家高速公路交通安全管理局(NHTSA)、國家司法援助局(BJA)和國家司法研究所(NIJ)聯合成立了一個「數據驅動的新方法:犯罪和交通安全」的工作組,在馬裡蘭、堪薩斯等州的城市開展聯合治理的試點。16

試點的重點內容是針對犯罪活動和交通事故,為基層警隊建立一套完整、嚴謹的數據整合、分析的系統。由於情況的波動,1年的數據往往不可靠,必須累積3年的數據作為分析的基礎;10萬人口以下的城市必須使用4到5年的數據。此外,犯罪活動和交通事故極少發生在完全一模一樣的地點;除了收集數據,還要在地圖上運用簇群關聯的數據顯示技術,才能劃分確定兩種活動頻發的共同區域。

確定了共同的「黑點」,就可以將交通警察和治安警察的資源整合到一起,有的放矢,在特定的時間、特定的地點開展聯合治理,這不僅能提高警力使用的效率,還可以改善執勤巡邏的效果。

聯邦政府工作組的試點取得了非常顯著的效果,試點區域的搶劫、盜竊等犯罪活動明顯下降,同時,違規駕駛的罰單明顯增多。2008年,為了在更多的地方政府推廣這種模式,該工作組總結了試點經驗,制訂了項目實施的基本原則,其中最重要的一條就是:數據收集和數據分析必須成為基層警務部門的一種文化,這種文化代表著基層警務部門一種管理哲學的改變,這種改變,也是該項目實施過程最大的挑戰。

這種基於數據的警務管理模式,也引起了學術界的高度關注,有學者將其概括為「數據驅動的警務管理」或「數據驅動的司法管理」(Data-Driven Policing or Justice)。

註釋

01 Governing by Numbers: The Promise of Data-Driven Policymaking in the Information Age, Daniel C. Esty, Reece Rushing, April, 2007.

02 這個數據綜合了皮尤研究中心(Pew Research)和蓋洛普咨詢公司(Gallup)2010年問卷調查的結果。

03 英語原文為:「China had 78 million vehicles on its roads at the end of last year, roughly one-third as many as the United States. But China has nearly 70,000 police-confirmed traffic deaths a year, twice the figure for the United States. The actual discrepancy may be even greater. Chinese and Western traffic safety experts say that while the United States figures are extremely reliable and take into account virtually every death, only a small fraction of all traffic deaths in China show up in official figures because of widespread underreporting by the local police.」— Road Safety Problems Pose Dire Threat in China, New York Times, July 26, 2011

04 英語原文為:「I will build a car for the great multitude. … But it will be so low in price that no man making a good salary will be unable to own one — and enjoy with his family the blessing of hours of pleasure in God's great open spaces.」—My Life and Work (1922), Chapter IV, Henry Ford

05 之所以稱為「記錄系統」,是受限於當年信息技術的發展水平。其英語原文為:「Effective record system of accidents … to determine the probable causes of accidents, injuries, and deaths.」—P.L. 89-564, section 402 (a). (U.S. Code Title 23)

06 該網頁地址為:http://www-fars.nhtsa.dot.gov/Main/index.aspx

07 「But freedom is not enough. You do not wipe away the scars of centuries by saying: Now you are free to go where you want, and do as you desire, and choose the leaders you please. You do not take a person who, for years, has been hobbled by chains and liberate him, bring him up to the starting line of a race and then say, you are free to compete with all the others, and still justly believe that you have been completely fair… We seek not just freedom but opportunity…To this end equal opportunity is essential.」—Commencement Address at Howard University, Lyndon B. Johnson, June 4, 1965

08 Chrysler Corp. v. Brown, Secretary of Defense, 441 U. S. 281 (1979).

09 Testimony on Data Mining Results and Challenges for Government Program Audits and Investigations, United States General Accountability Office, March 2003.

10 http://www.cms.gov/nationalhealthexpenddata/downloads/highlights.pdf

11 FBI's Annual Financial Crimes Report for 2007, Federal Bureau of Investigation.

12 Medicare Program Integrity, Timothy B. Hill, Testimony Before Subcommittee on Health and Oversight and Investigations, Committtee on Ways and Means, U.S. House of Representatives.

13 英語原文為:「There is a spark of idealism within every human being that can be fanned into flame, and will bring forth extraordinary results.」—Louis Brandeis

14 Report of the Task Force on Crime Mapping and Data-Driven Management, U.S. Department of Justice, Attorney General Janet Reno, July 1999.

15 英文名稱為:National Partnership for Reinventing Government,該委員會是克林頓執政時期為在聯邦政府推行行政改革而成立的臨時組織。

16 Data-Driven Approaches to Crime and Traffic Safety, DDACTS, Data-Driven Approaches to Crime and Traffic Safety Operational Guidelines, National Highway Traffic Safety Administration, August 2009.