讀古今文學網 > 人工智能:改變世界,重建未來 > 人工智能新主流 >

人工智能新主流

如今,深度學習神經網絡已經成為人工智能的主流,其強調的理念可以追溯到麥卡洛克和皮茨。儘管該理念仍然是對大腦工作模式的一種模擬(我們將在後續章節中探討更多關於大腦的生物力學模型),但神經網絡能夠解決問題的廣泛性卻令人驚歎。傳統人工智能一直表現良好,直到後來研究人員才發現現實世界與其完美模型並不匹配。與傳統人工智能不同的是,神經網絡不僅能夠處理規律性事物,還能夠處理規則以外的情況。正如20世紀80年代的NETtalk一樣,這使其成為處理語言等棘手問題的最佳選擇。深度學習神經網絡還擅長處理所謂的「分佈表徵」,這意味著其具有模擬同一表徵空間中兩個相似但獨立的領域(例如語言和圖像)的能力。從本質上來講,這意味著神經網絡能夠以類比的方式進行思考,這一點是傳統人工智能無法企及的。

傑夫·辛頓說道:「現在我們看到的許多事物都在使用神經網絡。根據經驗,如果你想完成一項任務,並且你知道這項任務涉及大量知識,這意味著如果你要學著做這件事,你將需要大量相關的參數。在這種情況下,深度學習將是更好的選擇。」

令人印象深刻的應用程序隨處可見。2011年,就在辛頓加入谷歌之前的那個夏天,谷歌工程師傑夫·迪安(Jeff Dean)、格雷格·科拉多(Greg Corrado)和斯坦福大學計算機科學家吳恩達(Andrew Ng)共同推出了「谷歌大腦」(Google Brain)項目。谷歌大腦項目都在谷歌公司半公開的實驗室「谷歌X」中進行,使用深度學習網絡識別高水平概念,例如通過分析視頻網站YouTube的視頻中靜止的圖像來識別貓,而之前並不向它解釋貓到底是什麼。(巧合的是,這實際上就是弗蘭克·羅森布拉特半個世紀前對《紐約客》雜誌說過的「神經網絡終有一天能夠實現」的那個目標。)

聽起來一台知道貓為何物的計算機並沒有什麼新奇的,但是通過深度學習實現計算機的視覺能力,在現實世界中卻擁有廣泛的用途。一家名為「Dextro」的初創企業使用深度學習創造出了更好的在線視頻搜索工具。Dextro的神經網絡並不依靠關鍵詞標籤,而是通過掃瞄直播的視頻來分析音頻和圖像。舉例來說,如果用這個神經網絡搜索英國前首相戴維·卡梅倫,那麼不僅能夠搜出與保守黨有關的視頻,就連提到英國首相的視頻也能夠搜到。

與此同時,Facebook(臉譜網)使用深度學習自動為圖像設置標籤。2014年6月,這一社交網絡平台發佈了一篇文章,介紹其稱之為「DeepFace」的面部識別技術。憑借深度學習的能力,Facebook算法幾乎和人腦一樣準確,無論光線和相機角度如何,都能夠對比兩張照片並查看其顯示的是否是同一個人。此外,Facebook還使用深度學習創建了另外一種技術,該技術能夠為盲人用戶描述圖像,例如,一張圖片上顯示的是某人在一個夏日騎著自行車穿過英國的鄉間小路,該技術能夠用語音將這一情景描述出來。

其他一些項目將深度學習和機器人學結合起來。美國馬裡蘭大學的一組研究人員給機器人放了一段YouTube上的烹飪視頻,這樣就教會了機器人如何烹飪一頓簡餐。這一過程中沒有任何直接人為的輸入,只要提供正確的餐具,機器人就可以直接複製視頻中顯示的任務,而且準確率非常高。長遠來看,類似的機器人深度學習也可以應用於軍事維修等領域。

目前已經證明,深度學習在翻譯領域是必不可少的。2012年12月,微軟的研發總監裡克·雷斯特(Rick Rashid)展示了一款震撼人心的英漢語音識別和翻譯系統。通用翻譯器這樣如同「星際迷航」的英雄夢一樣的技術即將實現,這項技術意味著在不久的未來,我們無須會說法語、俄語或日語就能夠在法國餐館點菜、在俄羅斯坐出租車或在日本談生意。更加令人印象深刻的是,深度學習系統能夠將說話者的語音劃分為基本的音素,然後將這些音素重新組合成需要的語言,最後以說話者的聲音將語言「說」出來。微軟解釋道:「你的平板電腦或智能手機將分析你所說的意思,將其翻譯成聽者能夠理解的語言,並用你的聲音以聽者熟悉的發音、音色和音調表達出來。」

有趣的是,雖然我們一直在對基本的技術進行調整,但如今許多重大進步仍可以追溯到戴維·魯梅爾哈特和傑夫·辛頓在20世紀80年代發明的反向傳播算法。這些年來唯一改變的是計算能力,而計算能力反過來意味著更強大的神經網絡和更多隱藏層。僅「谷歌大腦」項目就將16萬個計算機處理器連接起來,創建了一個擁有10億多連接的人造大腦。可用訓練數據集的規模也在大幅增長。前些年使用的數據相對較少,與其相比,如今用於教神經網絡思考的信息數不勝數,舉例來說,Facebook的面部識別系統就是通過分析740萬張圖像來訓練系統的,這些圖片是Facebook 12.3億活躍用戶的臉。

神經網絡不是如今實踐中用到的唯一一種人工智能(我們將在後面的章節探討其他人工智能),其優勢將人工智能推到了勝利的頂峰。與傳統人工智能不同的是,神經網絡不再局限於簡單的實驗室環境。

實際上,下一章將探討的內容是,當人工智能超越我們通常所說的計算機系統的限制並跟隨我們一起進入現實世界時,到底會發生什麼。

[1] 1澤字節=270字節。——編者注