讀古今文學網 > 終極智能:感知機器與人工智能的未來 > 第二章 當今世界與不久之後的將來 03. 網絡時代的安全 >

第二章 當今世界與不久之後的將來 03. 網絡時代的安全

1945年5月2日,就在5月7日德國投降的前幾天,美國軍隊從南巴伐利亞向奧地利邊境進軍。突然,一名年輕人騎著自行車接近了沿這條路行軍的反坦克部隊。他告訴士兵們,一群隸屬於著名的德國V–2部隊9的科學家躲在附近的一家旅館中,並且準備正式投降,其中包括赫赫有名的沃納·馮·布勞恩(Wernher von Braun)和其他幾十名資深火箭科學專家。他們最終被帶到美國,並為20世紀中期和末期的「太空競賽」做出了卓越貢獻。美國不但要考慮如何將這些傑出人才,或「人力資本」,帶回國內,同時又要避免暴露他們與納粹黨的關係,他們還必須搜查位於特爾維克開發V–2火箭的巨大隧道和特爾維克工廠。如果他們希望從那裡的工程知識中獲益,就必須拆卸、打包和搬運大量V–2部件,這樣才能在美國進行複製。

美國建立了一支專項工作小組。該小組名為V–2特殊任務組,其使命是裝載和運輸所有火箭部件。一列列擁有40節車廂的列車滿載拆卸後的部件,連續9天晝夜不停地往返運輸,將這些材料從特爾維克運到安特衛普。當最後幾節列車於5月31日到達荷蘭時,所有火箭部件被裝入16艘自由輪上運往新奧爾良。在這些船上,十幾枚被拆卸的V–2火箭的零部件上均帶有納粹的標識,這是美國國家航空航天局(NASA)和美國空間探索的第一批重要資產,同時也是工業時代最大的知識財產轉移之一。

● ○ ●

我們都知道俄羅斯黑客在2016年11月美國大選中所扮演的角色,但當下的網絡安全問題不僅出現在政壇,它們可以說是無處不在。許多黑客事件影響巨大,被全球媒體廣泛報道,如塔吉特和家得寶的信用卡醜聞10、導致冰島首相辭職的巴拿馬文件洩露11、巴基斯坦謝裡夫政府的垮台以及近期土耳其電網全國故障 12等基礎設施入侵,在網絡時代維護安全成為21世紀最大的挑戰之一。2016年9月,雅虎在其工作報告中指出,「美國支持的行動者」在2014年末至少盜取了5億個用戶賬戶。13不幸的是,不久之後「史上最大數據洩露」這一「成就」就從雅虎頭上轉移到其他公司、政府機構或國際組織身上了。

下一次,這種威脅可能就不光是盜取數據了。在2016年的拉斯韋加斯黑帽安全技術大會上,據汽車網絡安全研究者查理·米勒(Charlie Miller)和克裡斯·瓦拉塞克(Chris Valasek)透露,現在只需要使用筆記本電腦就能輕鬆入侵目前在道路上行駛的數十種車型。藍牙、Wi-Fi、蜂窩網絡和無鑰匙啟動等功能使汽車更容易遭受外部滲透。14

黑客可以設定程序,使汽車啟動失靈或使行駛中的汽車失去動力,而最糟糕的是,一旦網絡戰爭全面爆發,所有汽車都可以作為動能武器。

鑒於這些威脅,網絡安全已不再局限於硬盤和磁盤上的數據。隨著物聯網的出現,現實世界將以我們無法理解的方式與數字化技術融合。每天我們都通過快速增加嵌入式傳感器不斷地使物品與網絡建立連接。高德納咨詢公司曾經預測,2017年全球有84億件物品聯網,比2016年增加了31%。該公司的分析師預測,到2020年,這一數字將達到204億。截至2017年末,我們在端點和服務上的總支出已接近2萬億美元。15

我們的領導者一直都知道這種連接所帶來的危險。2015年,時任美國總統奧巴馬就已認識到網絡威脅的嚴重性。奧巴馬將這種威脅稱為「我們國家所面臨的最嚴重的經濟與國家安全挑戰」。16他要求國會撥款190億美元專門用於網絡安全行動。17

儘管人們的擔心不斷加劇,政府機構仍在處理即將到來的網絡安全威脅方面捉襟見肘。安全風險分析公司SecurityScorecard認為,在抵禦惡意軟件感染和惡意攻擊方面,美國聯邦、州和地方政府排名倒數第一,落後於運輸、零售和醫療等17個主要的私人行業。

2015年7月,美國人事管理局的210多萬份敏感數據被洩露,該事件充分證明了美國政府部門網絡安全的脆弱性。18

作為開放性和分佈式信息交換中心,美國和歐洲的研究型大學每週面臨著數百萬次的網絡攻擊。威斯康星大學麥迪遜分校的科研政策聯席副主任比爾·梅倫(Bill Mellon)告訴《紐約時報》,該大學每天要遭到9萬 ~10萬次黑客攻擊,黑客的目的是滲透系統。19

21世紀的20世紀解決方案

我們在當前的環境中能夠做什麼?想一想報道中發現的威脅的數量,一家研究機構每天遭受10萬次系統滲透威脅,目前的網絡安全需要的是把手指伸入大壩的荷蘭小男孩[1],但我們沒法依靠這種孩子般的傳奇英雄行為拯救自己。

我們所繼承的安全行業,即產品架構以及組成文化的觀念和比喻來自40多年前。當時的世界是由不聯網的獨立計算機和網絡組成的,只有一小部分人懂得利用漏洞或有這方面的動機。在早期互聯網時代開放與透明的精神下,編程人員和科學家還為整個互聯網創建目錄和檔案。只有一小部分志同道合的、有著崇高理想的科學家才能使用最初的網絡。

直到1982年才出現了第一個真正「肆虐」的病毒——Elk Cloner。20這種病毒在Apple II計算機的軟盤上傳播,它能夠控制計算機的操作系統。病毒造成了巨大的損失並且成為後來各種網絡攻擊的鼻祖。這種病毒中還包含了一首頗具幽默文學色彩的短詩:

它將進入你的磁盤,

它將滲透你的芯片,

這就是Cloner!

它會像膠水一樣粘著你,

它還會修改隨機存儲器,

發送Cloner吧!

在人們發現這些惡意軟件和病毒後,網絡安全逐步成為一個蓬勃發展的領域。幾乎所有的早期殺毒產品都使用簽名來識別病毒和威脅。這種基於簽名的方法通過識別嵌入在文件中的線索探測惡意軟件。線索可能是文件中的一系列字節或者密碼散列(一種獨特的指紋)。這種基於簽名的檢測在結構上被比喻成一面靜態的牆:警衛會將所有「壞傢伙」視為危險,因此它會把所有「壞傢伙」擋在門外。與「二戰」時期法國的馬奇諾防線一樣,這面牆的安全結構中有太多不切實際的設想。這面牆認為在用戶成為目標前,有足夠的時間發現和分析所有威脅,可以設計簽名、開發補救方法並向用戶推送安全更新。

在互聯網時代早期,這種簽名檢測的解決方案似乎能有效應對網絡安全威脅,但隨著連接的增加,它們已變得幾乎毫無用處。2016年,據國際軟件安全集團卡巴斯基實驗室報告,其產品每天發現約323 000種新的惡意軟件文件,而在2011年,這一數字僅為70 000。21

簽名檢測的解決方案因方法過時而常常遭受嚴重的甚至是災難性的攻擊。比如2013年,黑客對《紐約時報》的網站進行了一次攻擊。根據《紐約時報》僱用的數據漏洞應對公司Mandiant的報告,在三個月的時間裡,殺毒軟件只發現了被植入網站的45種病毒中的1種。22

這個問題涉及殺毒工具的整個架構。現代網絡安全的有效性取決於其應對「零日攻擊」的能力。「零日攻擊」是指黑客集團利用開發人員和用戶都不知道的漏洞發起的攻擊。黑客通過在開發人員之前發現漏洞,使蠕蟲或病毒控制被感染的計算機系統。這種攻擊往往是在一段時間內出現的,這段時間被稱為漏洞窗口期,通常持續約一天,如今,由於威脅數量的增加,「零日攻擊」已變成「零月攻擊」,這是因為漏洞窗口期變得越來越長,而殺毒工具很難跟上每天新病毒的出現速度。

目前似乎只有一種可行的解決方案:通過人工智能增強安全。2016年,美國國防部高級研究計劃局宣佈舉辦網絡安全挑戰賽。23這場比賽類似於該機構舉辦的其他大型挑戰賽,比如製造可以繞過障礙物的機器人和無人駕駛汽車等,但這場比賽可能是該機構目前最複雜的、目標最遠大的比賽。參賽者需要設計出具有自我保護功能的軟件。有7個系統將在漏洞檢測、修復或補丁方面進行角逐,說白了就是比自我診斷和治療能力。這場比賽是一場攻防戰:參賽者需要找到對手軟件中的漏洞,同時保護自己免受可能的攻擊。從根本上說,訓練一個識別軟件漏洞的系統需要創造力和批判性思維。因此,這在過去是人類研究者的工作,畢竟軟件漏洞並不像一隻貓的照片那樣簡單。算法可以識別大量數據中直觀對象的模式,但它們可以在檢測未知的惡意軟件方面也做得同樣出色嗎?下面的故事將證明,這個問題的答案是肯定的。

WannaCry:加密病毒勒索

2017年5月12日,100多個國家的組織遭到了一次大範圍的勒索軟件攻擊,其中包括英國的16家醫院。24一種名為WannaCry的勒索軟件利用了未進行微軟三月份安全補丁更新的Windows系統中的漏洞。25

WannaCry勒索軟件可以打亂醫院計算機的數據,因此它對英國醫療系統造成了巨大的破壞。受感染的機構收到勒索消息,消息稱每台計算機需要支付300~600美元後才能對文件解密,而英國的醫院被迫拒絕一部分病人,只接受病情最危重的患者。

WannaCry讓數百家組織機構措手不及,但它並非完全無跡可尋。尖端人工智能反惡意軟件解決方案在攻擊發生的當天就捕捉到了這種病毒。全球這麼多傳統的安全系統都毫無防備,這個基於人工智能的安全解決方案是如何捕捉到這種新的威脅的呢?

正如我們之前所討論的,使用人力發現安全漏洞並開發針對惡意軟件的補丁,越來越像一場「打地鼠」遊戲。針對2014年出現的Shellshock和Heartbleed病毒以及現在的WannaCry等新型全球性病毒威脅,人工智能可以提供更加可靠的解決方案。如今的安全和網絡分析師正在設計能夠嗅探非法活動的人工智能算法,這種人工智能就像是一群受過良好訓練的獵犬。

我們需要瞭解這一過程,才能更好地解釋人工智能如何改變著我們目前的網絡安全策略。根據認知通道安排的人工智能算法現在已足夠先進,可以極大地縮小潛在調查對象的範圍,這就大大減少了人類安全分析師的工作量。最先進的網絡安全系統使用的數據採集自「蜜罐系統」,該系統是專為引誘攻擊者並主動捕捉安全威脅和黑客技術而設計的。然後,安全算法會調查請求的發出地點。攻擊中所使用的數據或負載會透露其戰術、技術和程序(TTP)以及此次試探是否成功。

這些認知通道還能結合算法與自然語言理解,因此它們可以將計算機日誌文件證據轉換為自然語言,就像人類調查員可能向搜索引擎提出的問題那樣。通過自動生成此類問題,算法可以從網絡上許許多多的網頁中獲得大量內容。機器學習算法可以在幾分鐘內讀取太字節,即一萬億個字符,因此它能處理所有信息並將這些信息用於驗證一個問題:該網頁傳輸的是威脅還是善意的內容?

在算法自動查詢了搜索引擎提供的大量文件後,自然語言理解就可以達成一個共識:這項基礎研究或者表明存在威脅,或者確定一開始的可疑數據沒有危害。

簡而言之,狹義的人工智能和自然語言處理更接近於人類安全研究人員的推理,但機器學習在處理信息時的速度要快得多,因此它幾乎可以在瞬間識別大量數據中的複雜模式。有人工智能技術支持的安全系統,可以在病毒被正式公佈甚至被命名前就標記出病毒。先進的威脅檢測軟件可以使用演繹推理,甚至歸納推理。這些創新所產生的結果就是人工智能讓我們能夠無須事先定義簽名就能處理威脅,並且在它們處於「野生」狀態時及時探測,從而避免對開放的互聯網造成嚴重破壞。

像WannaCry這樣的病毒不但會使網絡系統癱瘓,而且還能入侵用於急救的醫療機器,因此全球對先進保護措施的需求變得越來越迫切。事實上,醫療行業如今已成為面臨網絡攻擊威脅最嚴重的行業之一。26跨國犯罪組織將醫院和醫療服務提供者視為具有極高價值的目標,並系統性地開發和散佈入侵醫療記錄的勒索軟件,因為醫療記錄數據比信用卡數據的價值高出10倍甚至20倍。現代醫院中佈滿了傳感器和監視器,每張病床平均有10~15台設備,僅在美國就有近90萬張病床。再加上幾乎沒有任何網絡安全保護的個人醫療設備,每家醫院的生態系統都存在無數被威脅和利用的風險。

就像WannaCry一樣,如果一種病毒未被發現,黑客控制了整個系統,那麼他們就能進行勒索,要求對方支付加密貨幣或者像比特幣這樣的虛擬貨幣。如果他們沒有收到付款,就會在暗網(地下網絡)上將盜取的數據出售給出價最高者。時間就是生命,在整個系統被控制後,醫院病人可能無法獲得維持生命的關鍵設備和資源。

當發生WannaCry攻擊時,一位名為「MalwareTech」的安全分析師發現了殺死這種病毒的方法:一種可以阻止病毒感染更多系統的編程解決方案。微軟也發佈了緊急補丁以防止其他設備被傳染,但那些使用最精密的人工智能算法的網絡,在這些措施出現前就可以抵禦WannaCry的攻擊。配備了人工智能技術支持的安全解決方案在偵測到潛在威脅後,會向用戶和管理員發出警告並隔離病毒,從而避免急救設備出現系統癱瘓。人工智能不僅能夠給醫療行業帶來經濟和安全方面的優勢,它還能夠拯救生命!

認知通道

現在讓我們來更詳細地瞭解,面對網絡威脅,人工智能將採取何種戰術和技術加以應對。目前,網絡安全工具主要依靠人工,即採用簡單的靜態方式檢測異常。如果我們將此類工具比作業餘的股票交易網站,那麼認知計算解決方案就相當於「奧馬哈先知」沃倫·巴菲特(Warren Buffett)。這種算法有何過人之處,能與全球最聰明的投資家之一相提並論?下面我將做出解釋。

網站上提供的在線股票交易大多由非專業交易商經營,它們的交易主要基於基本的數據統計分析:先看看與公司財務健康或業績相關的幾個變量,再看看競爭對手,然後可能再進行一些比較,最後進行技術分析,比如繪製移動平均數或類似的統計函數圖等。總而言之,這個過程是進行不複雜的技術交易的基礎。

現在看看巴菲特。巴菲特不會採用這種純粹的統計方法。他根據多年來的經驗總結出一套理論,確定了評估一家公司或預測公司未來是否能夠成功時需要重點關注的方面。他從未公開這個「模型」的細節,這可能是因為這個「模型」無法被編碼。畢竟在評估公司方面,巴菲特本人就是一個會走會說話的「算法」,他所積累的知識經過提煉和調整,已從一種專業技術知識變成了一門藝術。巴菲特曾表示,除了許多其他需要考慮的因素之外,他把大量的時間用在評估公司當前的管理團隊上,並將這一項作為預測成功的重要指標。他的許多指標在我們看來可能是主觀的。我們之所以這麼認為,是因為它們可能是大量無法獨立發生的細節的組合,比如不經意的緊張顫抖、不自覺的翻白眼、緊緊握手、大笑等。為了建立像巴菲特「模型」那樣的高性能模型,我們也需要對這些細節保持敏感。我們需要收集各種看似主觀、實則相關的信息,包括結構化和非結構化的數據,用於預測和建模過程。因此,數據和統計僅僅是我們的工具之一,而不是一切。

巴菲特是一位頂尖的認知模型建立者,他可以教會我們很多東西。這就是認知安全技術與目前所使用的傳統技術的不同之處。認知安全技術具備詳細的觀察能力,可以發現不同的毫不相關的怪異和異常之間的聯繫。這種技術還必須可以擴展,能夠獲得大型機械數據以及供人類使用的非結構化自由形式的數據信息。除了自律和適應能力之外,它還必須具備自我治癒功能。認知安全技術的設計靈感來自我們的免疫系統,它可以保證一旦發現病毒,就阻止病毒的傳播,預防病毒的大規模出現。

沃倫·巴菲特一生積累了大量的模式識別經驗。他對這種主觀的情景信息越是習慣,他的錯誤就越少,而認知安全算法亦如此。本質上,這種認知通道採用的是一種科學方法:提出假設並進行驗證。文學作品中偵探的代表夏洛克·福爾摩斯(Sherlock Holmes)也是這樣。比如在一開始,福爾摩斯沒有假設基礎來指導他的觀察。然後,第一個證據引起了他的注意,第二個證據讓他找到了目標,第三個證據變成了三個數據點。現在,他就可以對這一趨勢進行進一步的調查。這就是框架。他的所有行動都是要填滿這個框架。比如,「我認為泰德用音樂教室裡的燭台謀殺了瑪麗」,「瑪麗是被謀殺的,但我目前還不知道兇手是誰或犯罪手法是什麼」。

使用多種機器學習算法的認知通道也能做到這一點。算法的調查包括所有以下問題:這是一個向我提出的善意的請求,還是有人在尋找我的站點的安全漏洞?這是一名終端用戶還是一個偽裝成終端用戶卻試圖入侵我的數據庫的人?通過使用結構化和非結構化的數據,即上文中所說的沃倫·巴菲特用於發揮自己最大優勢的主觀和情景信息,該算法能夠提出假設:我認為這是一個惡意軟件。接著,算法會進一步研究:「讀取」頁面並且更深入地搜索日誌、網絡活動或其他與該假設相關的證據。之後,認知通道能夠對最初的假設是否正確做出判斷,比如:對,它是一種惡意軟件;或者確認情況並非如此,無須進行進一步的研究。

科學作家瑪麗亞·康尼科娃(Maria Konnikova)在她的《福爾摩斯思考術》(Mastermind: How to Think Like Sherlock Holmes)[2]一書中概括了福爾摩斯的思考過程。27在該書中,她分析了在模式認知過程中,人與自身直覺之間的矛盾關係。

我們的直覺來自情景,而情景則由我們所在的世界決定。因此,直覺可能會成為一種障眼法,或某種盲點……但我們可以通過專注的思考找到事實之間的平衡,檢查我們的直覺並保持開放的思維。然後,我們可以通過所掌握的信息,在瞭解到時間可能會改變信息的形狀和顏色的情況下,做出最佳的判斷。

然而,機器學習在得出結論時不會有這樣的困境。根據我的經驗,人工智能得出的結論或提出的行動建議通常不是直覺行為。如果它們出於直覺得出結論或提出建議,那麼人工智能就好比是速度更快的人類研究者,但實際上其內容遠比這些更豐富。

我將經常在本書中提到這個觀點。作為人類智力的基礎,直覺是一種我們可以用於碰運氣的方便的思想工具。對於複雜的問題,人類的實用功能,也就是人類針對一個目標的諸多選項進行評估的方式,完全不如人工智能。本章第5節中金融市場的例子將會充分說明這一點。即便是「房間裡最聰明的人」也無法像人工智能一樣發現數據中違反直覺的模式。

在繼續討論前,我需要與大家分享一個我在寫到這部分時所發生的又一起勒索軟件事件。這種危險的新型加密病毒勒索是完全隱身的,它們破壞著我們的全球網絡體系並讓我們對人工智能網絡安全解決方案的需求變得更加迫切。

Adylkuzz:暗網的破壞力

當網絡安全行業正在努力修復WannaCry所造成的破壞時,一種更加隱秘的病毒已經開始攻擊系統並在暗網中得到了回報。2017年春,黑客集團影子掮客(Shadow Brokers)公佈了大量微軟系統漏洞。雖然微軟很快發佈了修復補丁,但全球的許多網絡系統依然存在漏洞。Adylkuzz病毒28開始利用這些漏洞,特別是利用美國國家安全局(NSA)已洩露的「永恆之藍」攻擊程序漏洞29。Adylkuzz的傳播速度不如WannaCry那麼迅速,但它可以產生更加嚴重的後果,它會安裝隱藏的「挖礦者病毒」,而不是加密信息。「挖礦者病毒」會生成一種名叫門羅幣的加密貨幣。Adylkuzz不僅會減慢計算機系統的速度或者進行勒索,而且會劫持計算機,使它產生用於網絡犯罪的貨幣。它所挖掘的加密貨幣與比特幣相似,但更加隱蔽,因此是販毒、盜取信用卡和銷售假冒偽劣產品的地下網站的首選。Adylkuzz在系統中偷偷挖掘門羅幣的時間越長,網絡攻擊者獲得的金錢就越多。

我們需要先進的認知型反惡意軟件程序攔截此類威脅。人工智能安全系統通過使用經過數百萬惡意文件訓練的機器學習算法,可以在隱藏的「挖礦者病毒」造成巨大損失前發現這種蠕蟲病毒。

網絡安全專家認為,最先進的人工智能解決方案早在2017年4月24日就已經發現了Adylkuzz的存在,這比宣佈WannaCry還早了幾天。最先進的機器學習可以在幾秒鐘內使Adylkuzz變得無效,而這一切在人類分析師還沒有介入之前就已經發生了。

第三個抵消戰略

當然,軍方已經可以熟練地應對這些安全問題了。2015年1月,美國國防部副部長羅伯特·沃克(Robert Work)提出了第三個抵消戰略,描述了美國目前的國家安全情況。30第一個抵消是核武器,或者說使用大規模武力消滅敵人的攻擊機會。第二個抵消出現在核武器過多,從而變成零和博弈的格局時。當時,美國國防部轉向以少量火力精確打擊敵人的戰略。第二個抵消戰略的頂峰就是海灣戰爭,但不可避免的是,邪惡勢力和許多反對美國的國家已擁有此類小型智能武器,並且威力接近美國的「戰斧」,一種遠程全天候亞聲速巡航導彈。沃克認為我們已經來到了第三個抵消階段:通過快速整合和大規模應用人工智能建立國防技術優勢。這需要在所有層面實現自治,使人類不再參與大部分決策 –行動循環。

沃克在白宮會議上表示:「在20世紀50年代和70年代,軍事優勢一般來自軍事實驗室,但現在,優勢來自機器人。自主操作指導和控制系統、可視化、生物技術、微縮化、先進的計算和大數據以及疊加製造(如3D打印),所有這些技術的發展都是由企業帶動的。」

在第三個抵消時代,印度和伊朗等國家正在努力成為其所在地區的領導者。它們知道自己的海軍無法與美國傳統的航母艦隊相匹敵,所以使用不對稱的蜂群戰術。中國則大力投資基於人工智能的巡航導彈。

美國也繼續回應。2016年秋,由美國國防部高級研究計劃局資助的一個項目在快速飛行的F/A–18噴氣式飛機上部署了100多架小型無人機。31這些噴氣式飛機飛到靠近目標的地點後放出了Perdix無人機。隨後,無人機使用自主算法聚集在目標區域。這些實驗無人機可以執行監視、排除實際威脅等多種任務。以集中式命令和控制為核心的舊戰爭模式,現已逐步被新的人工智能戰爭模式所取代。除此之外,決策 –行動循環,也就是OODA循環(觀察、定向、決定、行動循環)與人類智能的關聯性越來越小。衝突緊迫性的加劇催生了對新型自主決策機制的需求。我們將在下一節「戰爭與人工智能」中詳細探討人工智能在戰場上互相對抗的未來戰爭。