讀古今文學網 > 大數據 > 第五章 帝國的法則 >

第五章 帝國的法則

一個公眾的政府,如果缺乏公眾的信息,或者缺乏收集信息的方法和手段,那它只不過是一個短暫的序幕,拉開的將是一場鬧劇或悲劇,也可能既是鬧劇又是悲劇。知識將永遠統治無知:人民如果想要當家做主、主導自己的命運,就必須用知識的力量來武裝自己。01

——詹姆斯·麥迪遜,第4任美國總統,1822年

聯邦政府這個龐大的數據帝國,是如何運作和管理的呢?

沒有規矩,難成方圓。這又不得不談到美國的立法工作。美國是個法制極其發達的國家,上個世紀以來,美國國會、政府先後通過了上百個大大小小的法規,分別對數據的收集、發佈、使用和管理等關鍵環節都做出了具體的規定。

更重要的是,美國人民對於這些法規中不合理的地方,也沒有等閒視之,而是不斷地提起法律訴訟,最高法院再通過新的判例查缺補漏,推翻國會和政府制定的一些不合理規定。經過幾十年的發展,聯邦政府對於數據的收集、發佈、使用和管理,已經形成了一個比較成熟的框架和體系。

收集法則:減負,為人民減負

當收集信息時,每一個機構都要告訴其收集對像以下信息:收集這份信息的目的、將來使用的方式、對其負擔的估計,以及這次信息收集工作是志願的、法定的或是有報酬的。最後,還要告訴他們:如果沒有「信息收集許可號」,任何人都可以拒絕填報。

——《紙面工作精減法》第3506(B)(iii)款,1996年

1980年,為了規範、控制聯邦政府的信息收集工作,美國國會通過了《紙面工作精減法》(Paperwork Reduction Act)。

該法規定,所有的聯邦政府機構,必須在得到行政管理預算局(OMB)批准之後,才能向社會和公眾收集數據和信息,國會並且決定,在行政管理預算局新設一個「信息和管制辦公室」(OIRA),統管聯邦政府的信息收集工作。該辦公室還負責發佈行業管制標準的職能,這些標準,其實也是數據。關於這個職能,本書將在下一章具體介紹。

任何一個部門,如果要向社會收集數據和信息,必須事先向OIRA辦公室提出申請、填報83-I表格,並提前60天在《聯邦公告》(Federal Register)上昭告社會,就收集信息的內容和方式聽取其他部門和全社會的意見。

走完這個程序,證明了其收集內容的合理性、收集方式的科學性,才能得到OIRA辦公室的批准:收到一個由該辦公室統一編發的「信息收集許可號」。缺少這個號碼,就沒有合法性,任何機關都不能向公眾收集信息;對沒有標明許可號的信息收集表格,公民有權拒絕填報。

《紙面工作精減法》是規範指導美國聯邦政府日常運作的一個重要法規,要理解它的精髓,首先要明白,政府的信息收集工作,需要公民和社會的配合,對公民和社會而言,這是一個負擔。1980年國會設立該法的根本目的,就是為了控制這個社會負擔、減少「信息擾民」。

本書第三章談到,聯邦政府的數據主要有3個主要來源:一是業務工作的數據,二是社情民意的數據,三是物理環境的數據。這三種數據,互有交叉,各種數據的收集方式,也各不相同。

這種劃分方法,依據的是數據的性質和來源。

當我們知道聯邦政府的信息收集工作對社會是一個負擔的時候,可以換一個角度,從法律的角度來考察公民和社會向政府提交信息的義務,就這個角度而言,聯邦政府要收集的信息可以劃分為強制提交、選擇提交和志願提交3種。

聯邦政府數據來源兩種不同的劃分方法

從數據收集方的角度按數據的性質劃分,有交叉

按信息提交方的提交方式劃分,無交叉

按提交方式的信息分類

強制提交的信息:公民和社會組織必須依法提交的信息,如企業和個人的納稅情況、工廠的排污量、車間的衛生指標、產品中各種化學物質的含量等等,提交這些信息,是法定的義務。

選擇提交的信息:對於一些政府補貼或社會福利項目,公民和組織如果決定申請,就必須填報表格、提交信息,以證實其符合該項目的要求。否則,政府可以拒絕其申請。

志願提交的信息:多指政府開展的一些基於社情民意的調查,如政府機關為徵求公眾意見開展的調查,參不參加調查、提不提交數據,完全取決於公民和組織的自願。正因為公民有權拒絕,聯邦政府常常為這些調查提供一些報酬和獎勵,以鼓勵社會的參與。

信息和管制辦公室(OIRA)每年都要編製「年度信息收集預算」(Information Collection Budget),這個「預算」,並不是指聯邦政府為了完成信息收集的任務,要花多少錢,或者要投入多少人力和時間,也不是指要收集信息的數量,而是去計算政府機構的信息收集計劃會給全社會帶來多大的負擔(Information Collection Burden)。這個負擔,以小時數來計算。也就是說,美國人民要完成政府規定的信息提交任務,需要投入多少時間。

其計算方法別具一格,有必要簡單介紹。

例如,為了完成某項業務工作,某聯邦政府機構確定了必須從社會收集某組信息,該收集工作一年需要進行兩次,每次需要1000個單位或個人填報,完成一次填報需要一個人投入5個小時,這5個小時包括用於閱讀說明、填報數據、檢查提交的全部時間。那麼,這份信息收集工作的社會負擔將是:

根據這個計算方法,該部門將確定這項信息收集工作的年度負擔為1萬小時,再提交OIRA辦公室審核。OIRA辦公室如果確定其收集的內容和其他部門沒有交叉,收集方法科學合理,將批准該機構1萬小時的年度信息收集預算。

這也正是該法被命名為《紙面工作精減法》的原因:通過OIRA辦公室把關,科學規劃,避免重複收集,確保收集信息的方式簡潔有效,盡量減少普通公民和社會組織的信息填報負擔。

1995年,聯邦政府信息收集負擔為65億小時。

65億小時是個什麼概念呢?

這相當於320萬人一年的工作量。也就是說,除了填報表格,320萬人什麼也不做,需要一年才能完成聯邦政府下達的信息收集任務。

為了應對越來越繁重的信息收集任務,美國國會曾先後於1995年、1996年對《紙面工作精減法》進行了修訂。OIRA辦公室也曾經制訂過「減負計劃」:從1996年開始,每年的信息「擾」民時間必須減少10%。

但OIRA辦公室明顯錯誤地估計了形勢。

這時候的美國,已經不折不扣是一個信息社會,對信息的需求已非人力所能控制。OIRA辦公室縱然有心減負、大力控制,也沒能擋住各個部門年年遞增的信息收集預算。

和1995年相比,1996年聯邦政府的信息收集負擔不降反升,達68億小時,其後年年上升。根據OMB每年公佈的信息收集預算報告,2009年,聯邦政府的信息收集負擔達到99億小時,較10年前的72億小時上升了37%。

當然,這也從另外一個方面證實了聯邦政府所擁有的數據總量確實在大幅上升。

信息收集預算不斷攀升的原因主要有兩個。一是美國國會在不斷制定新的法規,新的法規往往要求收集新的信息,各聯邦部門「不得不從」,例如2009年的財政年度,僅僅因為國會2008年通過的新法規,聯邦政府的信息收集預算就增加了5500萬個小時;02二是因為一些選擇性提交的數據有很大的波動性,例如,失業人數的增加,會導致申請社會福利人數的增加,從而導致全社會填報信息的負擔增加。

1999—2009年聯邦政府信息收集負擔預算明細分析

說明:聯邦政府財政部一個部的信息收集預算佔全部預算的80%左右,這是因為,幾乎全美每一個個人、家庭都需要報稅、退稅。財政部收集的信息不是最多,但涉及面卻最廣,所以給全社會造成的負擔也最大。(數據來源:OIRA辦公室《年度信息收集預算》)

年年喊減負,負擔卻年年上升。儘管責任不能全部歸咎於政府,OIRA辦公室的臉上也掛不住。2010年,OIRA又審時度勢、隆重推出了五項減負措施:

1.盡量推行具有自動計算功能的網絡填報方式(fillable fileable form);03

2.在確保安全的情況下,盡量使用電子簽名,以減少信息傳送、投遞的時間;

3.降低信息收集的頻度;

4.簡化行政過程,避免信息項的重複收集;

5.減少小型企業的信息收集負擔。

1999—2009年聯邦政府信息收集負擔的增長趨勢

按理說,政府負有管理社會的責任,為完成「公務」,向社會收集信息,聽起來天經地義。美國的聯邦政府為什麼要年年喊減負呢?

這是因為,當今的時代,已經不是「普天之下,莫非王土;率土之濱,莫非王臣」的時代。現代的政府,必須經人民授權產生,它的大政方針,必須符合民意。一個經授權產生的政府,凡事當然都要以授權人的利益為準,凡事都要經得起授權人的質詢。

這也是為什麼美國政府會把信息收集對社會造成的負擔作為衡量信息收集工作重要標準的根本原因。

其實可以預料,OMB關於信息減負的理想難以實現。這是因為,在當前的社會,信息不僅越來越多,其重要性也不斷上升,在人、財、物等各個管理要素之間,信息的樞紐作用越來越明顯。有效的社會管理,無疑需要更多的信息。

雖然減負的目標不可實現,但OMB關於減負的目標和措施,卻是一個經人民選舉、授權產生的政府在面對人民時必須具備的姿態。

使用法則:隱私,文明社會的共識

隱私,是流淌在美國人血液裡的一種價值觀。04

——安娜·埃舒,美國眾議院眾議員,2002年

談到美國的隱私權,我們就繞不開「陽光是最好的防腐劑」這句至理名言的作者:路易斯·布蘭代斯大法官。

和奧巴馬一樣,布蘭代斯是哈佛法學院畢業的博士。前文提到,奧巴馬在哈佛就讀期間,曾經擔任過《哈佛法律評論》的主編。這本刊物,在美國法學界的知名度很高,正是布蘭代斯1887年在哈佛任教期間創辦的。

1890年,布蘭代斯與他的同學沃倫(Samuel Warren)就在這本刊物上共同發表了美國隱私權的奠基之作:《隱私權》(Right to Privacy)。在這篇文章中,布蘭代斯將「隱私權」定義為「不受別人干擾的權利」。他認為,這項權利是個人自由的起點,只有通過界定這項「人類最廣泛、文明人最珍視」的權利,個人的「信仰、思想、情感和感受」才能得到保障。

路易斯·布蘭代斯(1856-1941)

布蘭代斯是美國歷史上第一位擔任最高法院大法官的猶太人,也是美國歷史上知名度最高的大法官之一。其中的原因,在於他俠肝義膽、熱心社會公益事業,在他近30年的律師生涯當中,常常為社會弱勢群體代言,被稱為「法律界的羅賓漢」、「人民的律師」。(圖片來源:維基百科)

這種保障不僅僅意味著個人可以對抗他人對其自由的侵擾,也意味著個人享有不受新聞媒體、政府權力干擾和侵犯的自由。

隱私權的提出雖然僅僅只有100多年,但美國人重視「隱私權」的傳統卻可以追溯到17世紀的英國。

1647年,英國的法典就規定:

「一個人的房子,對他和他的家人來說,就是他的城堡。」

18世紀中期,英國首相威廉·皮特曾在國會的演講中說:

「窮人的房子,可能已經破敗、搖搖晃晃,風在其中穿梭。但風可以進、雨可以進,英格蘭的國王卻不能進,他的權力止於這間破房子的門檻。」05

美國最早意義上的隱私權,也正是集中在以住宅為代表的物理空間之上的。隱私權意味著一個人可以在自己的城堡中不受監督、不受干涉地發展自己的個性,決定自己的生活方式。

但隨著技術的發展,美國社會對於隱私權的保護也在發生深刻的變化,其重心不斷轉移,經歷了從住宅到人、再到信息的轉變。

布蘭代斯也是最早預見到技術的發展將會不斷侵蝕人類隱私的先覺者。

布蘭代斯訴訟方法(Brandeis Brief)

布蘭代斯的成就很多,他也是美國歷史上第一位在法律辯護中大量使用數據的律師。

1908年,布蘭代斯為俄勒岡州規定女性每天工作時間不得超過10小時的法案作辯護。他在法庭上出示的辯護書,與眾不同、轟動一時:僅僅用了2頁的篇幅作法律分析,卻用了100多頁的篇幅援引各種統計數據,以證明勞動時間過長對女性健康所產生的危害。他的辯護,最後獲得了最高法院9名大法官的一致支持。

這種用數據和事實而不是用法律先例來說明立法必要性和合理性的做法,開創了一種新的法律辯護形式,這種形式被稱為「布蘭代斯訴訟方法」,其後被法律界迅速採納。後世的許多重大案例,如爭取黑人兒童平等擇校權的布朗訴教育委員會案,辯護律師即因為採用了「布蘭代斯訴訟方法」,大量引用事實和數據,獲得了勝利。

1876年,貝爾發明了電話,這項新的技術極大地方便了人們的交流、推動了社會的發展,但也給隱私權投下了陰影。加上照相機、攝像機等新技術的相繼出現,隱私權開始面臨很大的挑戰:竊聽與日俱增,偷拍頻頻發生,「狗仔隊」的跟蹤氾濫,警方的秘密監控手段也越來越廣泛。布蘭代斯等一批先覺者開始意識到,除了住宅,即使在公共場所,個人的隱私權也存在著被侵犯的危險。

1928年,美國發生了隱私權歷史上著名的奧姆斯泰德訴美國政府一案。06

一位名叫奧姆斯泰德的普通公民涉嫌販賣私酒,聯邦調查局(FBI)的官員在沒有獲得「搜查證」的情況下通過對其住宅電話、辦公電話的搭線監聽,掌握了其犯罪證據。奧姆斯泰德因此被定罪。但奧姆斯泰德認為:聯邦政府的竊聽行為違反了憲法第四修正案對個人隱私權的保護,FBI利用這種手段獲得的證據不正當,應當予以撤銷,他於是上訴到最高法院。

布蘭代斯當時擔任美國最高法院的大法官。他支持奧姆斯泰德的上訴。但最高法院的9名大法官最後以5:4的比例駁回了奧姆斯泰德的上訴。5名大法官認為,FBI的秘密竊聽沒有物理性侵入奧姆斯泰德的住宅,因此不構成對其隱私權的侵犯。

這場官司之所以著名,是因為布蘭代斯大法官作為合審團的少數派,發表了他著名的「異見」(Dissenting Opinion):

「由於新技術的產生和發展,對隱私權的侵犯已經不需要物理的、強制性的侵入,這種新的侵犯正在以微妙的方式廣泛地衍生。這種侵犯即使是國家行為,如果沒有合法的審批,也應當被視為違憲。」

奧姆斯泰德雖然最後敗訴,但布蘭代斯的「異見」卻引起了廣泛的討論,對美國社會產生了深遠的影響。

1967年,又發生了轟動一時的凱茲訴美國政府一案。07這一年,美國最高法院終於以7:1的絕對多數完全採納了布蘭代斯的意見,推翻了對奧姆斯泰德一案的判決。

和奧姆斯泰德一案類似,FBI故伎重施,在公用電話亭搭線竊聽了當事人凱茲的談話,獲取了其參與組織賭博活動的關鍵證據,凱茲隨後被定罪。

凱茲以相同的理由上訴到最高法院,最高法院最後宣佈:FBI經竊聽獲得的證據侵犯了公民隱私權,為無效證據,予以撤銷。最高法院還在判決中明確:人類的隱私權,不僅僅限於住宅,無論何時何地,即使在公共場所,個人也享有隱私權,對其談話、通訊的侵犯,就是對其個人隱私領域的侵犯。

凱茲案成了美國隱私權保護從以「住宅」為重心到以「人」為重心的分水嶺。

近幾十年以來,由於信息社會的興起,美國社會對隱私權保護的重心再一次發生了重大的轉移。促成這種變化的原因在於政府和商業組織都收集了很多關於個人身份的信息。當個人身份數據(Personal Identity Information)廣泛存在於政府、銀行、醫院、學校、酒店、商場、公司等眾多組織當中的時候,每個人的活動其實無時無刻不在被不同組織的數據庫「記錄」和「監視」,這些數據如果被別有用心地利用和整合,個人的隱私和尊嚴將不可避免地受到侵害。

為了應對信息時代的這種衝擊,美國對於隱私權的保護,又逐漸從以「人」為重心調整到以「數據」為重心的思路上。

江山代有才人出。這時候,哥倫比亞大學的教授阿倫·韋斯廷(Alan Westin)成了這個新領域的理論先驅和領跑者,他將信息社會的隱私權定義為:

「個人控制、編輯、管理和刪除關於他們自己的信息,並決定何時何地、以何種方式公開這種信息的權利」。

1974年,尼克松的水門醜聞全面爆發,行政權力對個人隱私的惡劣入侵,引起了全美朝野上下的反思。此後,美國社會對政府的信任降到了一個歷史低點,增加政府的透明度、保護公民的隱私成了全民的共識。在這種情況下,1974年12月,美國國會通過了已經討論很久的《隱私法》(Privacy Act of 1974)。

美國隱私權保護重心的變遷

韋斯廷教授對數據隱私的研究,為1974年的《隱私法》確定了基本的原則。

阿倫·韋斯廷教授

其著作在西方世界曾經引發跨國性的數據隱私保護運動。代表作有《隱私和自由》(1967年)、《自由社會中的數據銀行》(1972年)。

1974年的《隱私法》是一部真正的信息時代的隱私法。它的保護主體就是存儲在政府機關內部的「個人信息記錄」,如個人的教育經歷、工作履歷、經濟活動、犯罪歷史等等記錄,它通篇規定的都是美國政府應該如何使用、保護公民的個人信息。

該法規定:行政機關收集保存的公民個人信息,只能用於信息收集時的既定目的;未經本人許可,不得用於其他目的;個人有權知道其信息的使用情況,還可以查詢、核對、修改自己被行政機關收集記錄的個人信息。

針對如何管理與個人身份隱私相關的數據,美國國會後來還通過了1986年的《電子交流隱私法》(ECPA)、1988年的《計算機查對和隱私保護法》(CMPPA)、2002年的《聯邦信息安全管理法》(FISMA)等法律。除了國家層面的立法,美國聯邦政府又制定了多個部門規章和實施細則,其中最重要的是1985年行政管理預算局(OMB)頒布並多次修訂的《聯邦政府信息資源管理政策》,也簡稱為A-130號通報(OMB Circular A-130)。

該通報明確規定了聯邦政府信息管理工作中的「隱私至上原則」:

水門事件(1974年)

在1972年的總統大選中,尼克松競選團隊的5名工作人員闖入位於華盛頓水門大廈的民主黨全國委員會辦公室,在安裝竊聽器並偷拍有關文件時,當場被捕。

尼克松起初推脫說並不知情,並利用總統特權,對調查行為百般阻撓。隨著調查的深入,越來越多的白宮官員身陷其中。證據表明,尼克松對此負有直接責任,他長期利用行政資源來收集政治對手的情報。

1974年8月,為了避免彈劾下台,尼克松主動提出辭職,成為美國歷史上第一位辭職的總統。

水門事件對1974年《隱私法》和1976年《陽光政府法》的出台都起了直接的推動作用。此後,每當國家領導人發生政治醜聞,便常被新聞界冠之以「門」的名稱,如本書後續將介紹的「伊朗門」。

「當聯邦政府的信息活動涉及個人信息時,個人隱私權必須切實得到保護。」08

「對於個人身份的數據,無論是靜態存儲,還是動態傳輸,都必須加密。」

這些信息時代隱私原則的確定,條條款款的背後都有爭議,本書將在第七章講述其中的故事。

當然,並非所有與個人相關的數據都是隱私。對於何種數據才算隱私,要分得一清二楚並不容易,美國的大法官們也沒少為這件事糾結,其中最著名的是1972年的聯邦政府訴米勒案09。通過這場官司,最高法院規定,個人的消費記錄不算隱私。

1972年12月,佐治亞州的警察搗毀了一個販賣、製造私酒的地下工廠,根據掌握的線索,警方懷疑當地的居民米勒是該案的幕後主謀。聯邦政府的調查機關給銀行發出了傳票,要求調閱米勒的銀行賬戶,最後從他賬戶的交易記錄中,掌握了其購買蒸餾設備、運輸工具和其他釀酒原材料的一系列證據,米勒因此被定罪。

米勒卻拒不認罪,上訴到法院,其律師認為,公民的賬戶記錄屬憲法第四修正案保護的隱私範圍,必須具有法院下達的搜查令才能獲取,政府調查機構的傳票沒有法定效力,其獲得的證據應當撤銷。

聯邦第五上訴法院支持了米勒的上訴,認為聯邦政府違反了程序,侵害了米勒的隱私權。

但聯邦政府不服,該案最後上訴到最高法院。

1976年,最高法院宣判,銀行的交易記錄不屬於個人隱私的範圍,因為個人的消費記錄必須在各個銀行、商家之間流動、交換,就像電話號碼一樣,無法保密,所以不能算是隱私。

米勒最終還是被依法定罪。

發佈法則:免費,人民已經交稅

所有機構因發佈信息而收取的費用不能超過其發佈信息的成本,不能將收集、處理原始信息的費用包括在內。10

——美國聯邦政府OMB A-130號通報,1985年

美國政府的信息收集工作以減少社會的負擔為目標,其信息使用又以隱私保護為原則,這些規定都和普通大眾息息相關,但還有一條幾乎和每一個普通公民的經濟利益都直接掛鉤的法規,你可能沒有想到,這條規定,卻源於聽起來毫不相干的美國《版權法》:

「美國政府的任何工作和作品,都不適用版權保護,但美國政府可以接受並擁有通過轉讓、贈予或其他方式獲得的版權。」11

這是1976年美國制定的《版權法》中的第105條。

這短短的一句話一錘定音:對於聯邦政府的工作和作品,無論是文字、圖像、軟件,還是信息和數據,只要是美國聯邦政府工作人員為了完成本職工作而取得的成果,都不能申請版權。

當然,美國政府可以接受轉讓的版權。例如,聯邦政府僱用某公司開發一個軟件,根據合同,該公司可能擁有該軟件的版權,但如果該公司將版權轉讓給政府,政府則擁有了該軟件的版權。此外,美國政府對它所有的工作和作品可以擁有海外的版權。

例如,攝影作品是一種創作,明確受到《版權法》的保護,但只要是美國聯邦政府工作人員為完成本職工作而拍攝的照片,一律沒有版權。

有無版權的根本在於收不收費。既然沒有版權,政府發佈的數據和信息,在法理上就沒有收費的理由和根據,只能全民共享、免費發佈。12

「免費」背後的邏輯其實也很清楚:政府的運行是以公民繳納的稅收為基礎的,就好像我們僱請別人來為我們工作,既然已經支付了工資,就不必為其中的某一項服務或工作成果,再付一次錢。

對於如何發佈數據,上文提到的A-130號通報(OMB Circular A-130)有具體的規定:任何聯邦政府部門收集的數據,必須無償與其他部門共享,如無法律明禁,還必須向全社會發佈。對外發佈信息,可以收取信息使用方一定的費用,但這個費用,只能用來彌補由於發佈信息這個環節產生的成本,而不能包括數據收集和數據處理等其他環節的成本。

這種收費模式,被稱為按邊際成本的收費。邊際成本,是微觀經濟學中的一個重要概念。

就政府的信息發佈而言,邊際成本是指多一個人看到這份信息政府需要投入的成本。例如,如果以CD碟的形式發佈信息,多製作一張CD的錢,就是邊際成本。如果通過印刷品發佈信息,多印一本資料的開支,就是它的邊際成本。

互聯網產生之後,最方便的信息發佈方式當然是政府網站,任何人都可以登陸政府的網站瀏覽信息和數據,1個人看和100個人看,對政府而言,幾乎沒有任何區別,那邊際成本就將下降到幾乎為「零」。

邊際成本(Marginal Cost)

邊際成本是指在一個特定的產量水平上,增加一個單位產量所需要增加的成本。例如對電腦製造商而言,多製造一台電腦需要投入的人工和原材料。

由於生產的規模效應,隨著產量的增加,邊際成本可能不斷下降。例如,生產第一台電腦的成本可能很高,但生產第100台時,其成本可能就低很多,生產第10000台的時候,其成本可能大幅下降。

邊際成本的不斷下降正是企業利潤的重要來源之一。

和邊際成本相對應的經濟學概念是「固定成本」。

既然互聯網上發佈信息的邊際成本幾乎為零,按照OMB A-130通報的規定,政府就不能收費;對公民而言,就意味著事實上的免費。

2008年,劍橋大學的經濟學家波洛克(Rufus Pollock)曾對政府部門發佈信息的收費方式做過系統的研究,他總結了3種可能的收費模式。13

波洛克指出,歐洲很多國家還在採用第一、第二種方式,政府利用其發佈的信息收取費用,以彌補行政經費的不足。這種做法,看起來為政府開源創收了,但由於其對信息的封閉和壟斷,對整個社會的經濟發展其實弊大於利。而美國政府採用的第三種方式,由於其開放性,將促進全社會的經濟增長,儘管這種增長難以量化,但其效果卻非常明顯。

政府發佈信息的3種收費模式

一是利潤最大化模式(Profit-maximizing),指的是政府借助自己獨家的信息壟斷優勢,向信息需求方收取市場化的價格。

二是平均成本模式(Average-cost or Cost-recovery):政府收取一定的費用,這部分費用直接用來支付政府從信息收集到信息發佈的所有開支。

三是邊際成本或免費模式(Marginal-cost or Zero-cost),指的是只收取信息發佈環節所產生的費用,也就是按信息發佈的邊際成本收取費用。

其中,最為經典的例子是美國海洋和大氣管理局(NCAA)發佈的天氣數據。該局不僅在互聯網上為公眾免費提供實時的天氣預報數據,還提供非常友好的批量數據下載功能。

在世界各國的經濟生活中,有不少行業,如農業、交通業、建築業、保險業、旅遊業,無一例外都和天氣的變化息息相關。美國商務部曾經做過一個專項分析,最後得出結論,全國有三分之一的GDP產值都和天氣情況緊密掛鉤。2008年,國家海洋和大氣管理局的首席經濟學家韋伊爾(Rodney Weiher)估算,僅全國的發電廠,因為得益於該局發佈的免費數據,從而可以預測下一天、下一周的發電量、優化資源配置,每年節省的經費達1.66億美元。14

相比之下,英國天氣預報數據的管理模式,是公私合營。政府和私營領域的公司合作,政府一方提供原始數據,私營公司則提供數據加工和市場營銷,兩者通過成立新的實體公司15實行利益分成。

英美兩國這種不同的模式,曾經引起過廣泛的研究和關注,經濟學家普遍認為,雖然難以通過定量研究準確地測量兩種模式的效果,但可以肯定的是,免費發佈的天氣數據是經濟發展的巨大助力。2001年,普華永道對此做過專門的調查,它的研究結果是:受益於免費的數據發佈模式,2000年美國天氣風險管理行業(Weather Risk Management Industry)的產值是整個歐洲的近60倍、整個亞洲的146倍。16差距如此巨大,表明了其原因不在「枝節」,而在「根本」。

2000年不同地區天氣風險行業大小的對比

說明:三個圓形的面積分別表示該地區的天氣風險行業大小。

當然,美國這種基於邊際成本的免費模式,也並不是每個人都喜歡,事實上,實施起來也有阻力。僅天氣數據而言,就有反對的聲音。2005年,參議員桑托勒姆(Rick Santorum)提出了《國家天氣服務職責法案》(The National Weather Service Duties Act of 2005),該法案主張,除了惡劣天氣的預警之外,國家氣象部門應該減少免費發佈數據的數量,因為這限制了商業競爭。桑托勒姆是2012年共和黨黨內的總統候選人,他的法案,代表了相當一部分議員的看法,當然,也代表了天氣預報產業資本家的利益。但發佈信息的邊際成本的免費模式已經深入人心,這個法案沒趕上全體投票,就在委員會階段胎死腹中了。

如前文所述,在美國,信息的發佈和公開是兩個很不一樣的概念,發佈是政府面向全社會的,公開是點對點、僅僅面對某一特定公民或組織的(具體區別請參見第一章第3節)。但發佈信息的邊際成本的原則也同樣適用於根據《信息自由法》公開的信息和數據。也就是說,當公民根據《信息自由法》提請信息公開時,聯邦政府只能收取因為該次查詢以及公開這則信息所產生的邊際費用,而不能收取政府為了收集、管理這份信息所產生的全部成本和費用。

管理法則:質量,互聯網時代的根本

數據能滿足其既定的用途,它才有質量。如果不能滿足既定的目標和用途,就談不上質量。換句話說,數據的質量不僅取決於它本身,還取決於它的用途。17

——傑克·奧爾森,數據庫專家,2003年

數據質量的問題,是一個涉及數據收集、使用、發佈等所有過程的問題。它的重要性,當然毋庸置疑。

雖然質量的問題貫穿整個數據管理工作的始終,但問題的爆發,常常發生在數據發佈的階段。

自從美國政府成立的第一天起,聯邦政府就開始發佈數據,但在沒有互聯網的時代,數據和信息的傳播渠道、讀者和受眾,都相當有限。隨著互聯網的出現,政府開始在網上發佈信息和數據,其受眾驟然劇增,傳播時間也大大縮短。

這對聯邦政府而言,是一個很大的挑戰。因為數據一經政府發佈,往往被視為權威,對社會的各個領域都可能產生重大的影響。

在互聯網時代,任何一份通過網絡發佈的信息,面對的都不是一個特定群體,而是全體國民。「足夠多的眼睛,將使所有的錯誤都無所遁形。」如果政府所發佈數據的質量不可靠,將受到頻繁的、大範圍的質疑,特別是一些可能會影響到公共政策和行業管制標準的數據,將引起巨大的爭議。所以,聯邦政府在互聯網上發佈數據,必須慎之又慎、保證質量。

為了保證數據發佈的質量,OMB曾經制定過3個指導原則:

一是質量要有標準,聯邦政府各部門必須制定衡量數據質量的統一標準,這個標準包括3個方面:

客觀性:指發佈的數據是否準確、客觀、可靠;

實用性:是否對社會有用;

完整性:是否能夠保證數據在收集、整理過程當中不受到非法的接觸和修改。

二是質量管理要有流程。政府各部門必須針對數據質量,完善信息管理的流程,防止低質量的數據出現。

三是要有質量救助機制。政府各部門必須建立一個行政機制來應對社會、公眾對於數據質量的質疑和挑戰;如果政府發佈的數據質量確實存在問題,必須有一個相應的糾錯機制來補救。

乍聽起來,這3個指導原則都簡單、直接,但落實起來,卻困難重重。

數據的完整性比較容易界定,但是何為「實用」、「準確、客觀、可靠」,就仁者見仁、智者見智,很難有一個統一的標準。在經過幾十年的紛爭和論證之後,OMB認為:

聯邦政府發佈的數據,其獲得的方式、產生的方法必須是透明的,也就是要向社會公佈你的數據收集方法,而且別人通過相同的方法,應該能夠產生、複製相同的數據。

這就要求政府要在發佈數據的同時,必須發布一系列的文檔,說明數據的來源、產生的方法,以及用戶複製過程當中可能出現的問題和錯誤。

另一個爭議的熱點在於,誰對數據質量有最終的裁判權?如果所發佈數據的質量不過關,聯邦政府的糾錯機制到底該如何運行?如果政府和社會對某項數據的質量有爭議,最終分歧不能統一,是否可以提起法律訴訟?

為了明確地回答這些問題,2001年,美國國會甚至通過了《數據質量法》(Data Quality Act)。但這個法律,還是沒有很好地解決問題,它引起了更多的紛爭,聯邦政府甚至因此多次成為被告,與個人、企業對簿公堂。欲知其中的曲折和詳情,請看下章分解。

註釋

01 英語原文為:「A popular government without popular information or the means of acquiring it is but a prologue to a farce or a tragedy, or perhaps both. Knowledge will forever govern ignorance: And a people who mean to be their own Governors, must arm themselves with the power which knowledge gives.」—Letter from James Madison to W.T. Barry(August 4, 1822)

02 Information Collection Budget 2010, Office of Information and Regulatory Affairs, P.5.

03 這是美國國家稅務局(Internal Revenue Service)率先推出的一種在線報稅系統,該系統直接與後台數據庫相連,能指導提示用戶填入信息,並能自動計算用戶需要繳納的稅收,大大減少了用戶填報稅表的時間。

04 英語原文為:「Privacy is a value that runs through the veins of the American people.」—Anna G. Eshoo, The Honorable Anna G. Eshoo, personal interview, 10 April 2002

05 英語原文為:「The poorest man may in his cottage bid defiance to all the forces of the Crown. It may be frail, its roof may shake; the wind may blow through it; the storm may enter, the rain may enter—but the King of England cannot enter; all his force dares not cross the threshold of the ruined tenement.」—William Pitt

06  Olmstead v. United States, 277 U.S. 438(1928)

07  Katz v. United States, 389 U.S. 347(1967)

08 該法規全文可見於美國白宮網站:http://www.whitehouse.gov/omb/circulars_a130#7,(2011-10-30)。

09  United States v. Miller, 425 U. S. 435(1976)

10 英語原文為:「Agencies set user charges for information dissemination products at a level sufficient to recover the cost of dissemination but no higher. They must exclude from calculation of the charges costs associated with original collection and processing of the information.」—Circular No. A-130

11 英語原文為:英語原文為:「Copyright protection under this title is not available for any work of the United States Government, but the United States Government is not precluded from receiving and holding copyrights transferred to it by assignment, bequest, or otherwise.」—Copyright Act of 1976

12 在政府收集的全部信息和數據當中,只有一個例外,這就是1968年通過的《標準參考數據法案》(Standard Reference Data Act)。標準參考數據,指的是某種物質的可以測量的物理和化學屬性,這種屬性可以用定量的數據表達出來。為物質屬性建立標準化的數據指標,是推進科學研究的重要手段。根據該法案,美國商務部可以對「標準參考數據」申請版權,並可以出售,出售的價格可以包括信息收集、編輯、評估、發佈以及行政管理的費用和成本。

13 The Economics of Public Sector Information. University of Cambridge, Rufus Pollock, November 2008, Available at http://www.rufuspollock.org/economics/papers/economics_of_psi.pdf.

14 Assessing the Economic & Social Benefits of NOAA Data, NAS/OECD Conference, Paris. Rodney Weiher. February 2008, at 17-18. Available at http://www.oecd.org/dataoecd/12/31/40066192.pdf.

15 該公司名稱為:Weather Exchange Ltd.

16  PricewaterhouseCoopers(2001)The weather risk management industry: survey findings for November 1997 to March 2001. Prepared for the Weather Risk Management Association, June 2001.

17 英語原文為:「Data has quality if it satisfies the requirements of its intended use. It lacks quality to the extent that it does not satisfy the requirement. In other words, data quality depends as much on the intended use as it does on the data itself.」—Data quality: the accuracy dimension, Jack E. Olson, 2003