讀古今文學網 > 人工智能:李開復談AI如何重塑個人、商業與社會的未來圖譜 > 第一章 人工智能來了 >

第一章 人工智能來了

人工智能已經來了,而且它就在我們身邊,幾乎無處不在。

我們真的知道什麼是人工智能嗎?我們真的準備好與人工智能共同發展了嗎?我們該如何在心理上將人和機器擺在正確的位置?我們該如何規劃人工智能時代的未來生活?

人類,你好!

“不管我們是碳基人類還是硅基機器人,都沒有本質的區別。我們中的每一員都應獲得應有的尊重。”

這是科幻文學巨匠亞瑟·克拉克(Arthur C.Clarke)在太空漫遊系列第二部《2010:太空漫遊》中描繪的一段對白。從情感上說,人類多麼希望有朝一日可以和人類創造的智能機器平等相處,共同發展。可有趣的是,每當前沿科技取得重大突破,為我們預示出人工智能的瑰麗未來時,許多人就又不約而同地患上人工智能恐懼症,生怕自己的工作乃至人類的前途被潛在的機器對手掌控。

“人工智能來了!”

這句話對不同的人群有著完全不同的含義。計算機科學家很少懷疑人工智能在推動人類技術進步上的偉大意義,這個意義甚至可以和人類發明蒸汽機、電力、核能,或者用火箭探索太空相提並論;社會學家、經濟學家更多地關注人工智能已經或即將對人類經濟結構、就業環境造成的巨大挑戰;科幻作家、影視編導和未來學家則樂於看到人工智能技術一次又一次激發起大眾如火的熱情,他們從不忌憚用最縹緲的想像將人類未來渲染成天堂或地獄……

可絕大多數不熟悉技術細節,或不具備瑰麗想像力的普通人呢?

普通公眾對人工智能快速發展的認知,始於2016年初Alpha Go的驚世對局。在欣賞圍棋對局的同時,人們總是不惜發揮豐富的想像,將Alpha Go或類似的人工智能程序與科幻電影中出現過的,擁有人類智慧,可以和人平等交流,甚至外貌與你我相似的人形機器人關聯起來。

圖1 電影《機械姬》的海報(該片曾獲得奧斯卡最佳視效獎)

“人工智能來了?他/她在哪裡?他/她長什麼樣兒?他/她說中文嗎?他/她是好人還是壞人?”

很遺憾,目前的人工智能並不像電影《機械姬》中的人形機器那樣美貌迷人。想像與現實間的巨大反差,讓不少人難以適從。在人工智能面前,公眾經常流露出好奇、迷茫或訝異的神情:

“人工智能有人格嗎?”

“我可以和機器人談戀愛嗎?”

“機器人會毀滅人類嗎?”

“人類是不是可以移民火星,留下機器人建設地球了?”

我們真的知道什麼是人工智能嗎?我們真的準備好與人工智能共同發展了嗎?我們該如何在心理上將人和機器擺在正確的位置?我們該如何規劃人工智能時代的未來生活?

想真正理解和認識人工智能,首先我們必須面對一個可能讓很多人難以相信的事實:

人工智能已經來了,而且它就在我們身邊,幾乎無處不在。

無處不在的人工智能

請拋開人工智能就是人形機器人的固有偏見,然後,打開你的手機。我們先來看一看,已經變成每個人生活的一部分的智能手機裡,到底藏著多少人工智能的神奇魔術。

圖2顯示了一部典型i Phone手機上安裝的一些常見應用程序。可能很多人都猜不到,人工智能技術已經是手機上許多應用程序的核心驅動力。

蘋果Siri、百度度秘、Google Allo、微軟小冰、亞馬遜Alexa等智能助理和智能聊天類應用,正試圖顛覆你和手機交流的根本方式,將手機變成聰明的小秘書;新聞頭條等熱門新聞應用依賴於人工智能技術向你推送最適合你的新聞內容,甚至,今天的不少新聞稿件根本就是由人工智能程序自動撰寫的;谷歌照片(Google Photos)利用人工智能技術快速識別圖像中的人、動物、風景、地點……快速幫用戶組織和檢索圖像,美圖秀秀利用人工智能技術自動對照片進行美化,Prisma和Philm等圖像、視頻應用則基於我們拍的照片或視頻完成智能“藝術創作”;在人工智能的驅動下,谷歌、百度等搜索引擎早已提升到了智能問答、智能助理、智能搜索的新層次;以谷歌翻譯為代表的機器翻譯技術正在深度學習的幫助下迅速發展;使用滴滴或優步(Uber)出行時,人工智能算法不但會幫助司機選擇路線、規劃車輛調度方案,不遠的將來,自動駕駛技術還將重新定義智慧出行、智慧交通和智慧城市;使用手機購物時,淘寶、亞馬遜等電子商務網站使用人工智能技術為你推薦最適合你的商品,而先進的倉儲機器人、物流機器人和物流無人機正幫助電子商務企業高效、安全地分發貨物……

圖2 i Phone手機上的人工智能相關應用

怎麼樣?聽起來,小小的手機屏幕上,人工智能是不是無處不在?來聽一聽最厲害的人工智能科學家們怎麼說。

我的導師——圖靈獎得主拉吉·瑞迪(Raj Reddy)說:“AI在主流社會中的應用有很多。IBM的深藍和Watson應該算是其中最廣為人知的代表。……另外一些知名的AI應用實例還包括:1)谷歌的翻譯系統,它能夠實現任意語言之間的互譯;2)像蘋果Siri、微軟小娜(Cortana)和亞馬遜Alexa這樣能夠進行對話的智能助手;3)近期一些在自動駕駛汽車領域的進展。”

而谷歌最資深的計算機科學家與軟件架構師、谷歌大腦開發團隊的帶頭人傑夫·迪恩(Jeff Dean)則說:“很多時候(人工智能)都是藏在底下,因此人們並不知道有很多東西已經是機器學習的系統在驅動。這裡面包括由語言理解系統所支持的谷歌搜索、谷歌翻譯、Gmail的快速回復功能,現在電話上的語音識別功能,像亞馬遜和Netflix上的推薦系統,像應用在谷歌照片上的圖像理解系統。”1

接下來,讓我們簡單分析、點評一下這些活躍在你我身邊,正在改變世界的人工智能技術。

智能助理

記得微軟小冰嗎?手機上最喜聞樂見的人工智能助理之一。與其他人工智能助理應用相比,小冰的語音識別能力、語音合成技術、基於大語料庫的自然語言對話引擎,都有著非常獨到、可圈可點的地方。據說,2016年9月17日是小冰的十八歲生日,截至這一天,小冰已經跟4200多萬人進行了200多億次對話,包括文字聊天、語音聊天、電話通話等各種形式。

圖3中是我和小冰關於美國總統競選的一段對話,有意思嗎?在這樣一個簡單的對話語境裡,小冰試圖表現出不偏不倚的中立態度,而且,她在討論嚴肅話題的時候,口氣上居然有三四分的調侃和戲謔。

圖3 微軟小冰為代表的智能助理類應用

嚴格地來說,小冰的智慧程度還遠遠趕不上人類,更多時候,她只是在事先積累的人類對話庫和互聯網資料庫中,查找最有可能匹配的回答。在不少特定的情形裡,比如上下文較複雜的場合,小冰經常答非所問,或有意無意地顧左右而言他。但很難否認,小冰及類似的智能助理程序,已經展現出初步的與人類溝通的能力。

像小冰這樣的智能助理應用有很多。蘋果公司早在2011年就發佈了i OS語音助理Siri;2012年,谷歌發佈的Google Now將智能助理的概念帶入了Android世界;2014年,亞馬遜發佈了基於Alexa平台,可以和用戶聊音樂的智能音箱Echo;隨後,2015年,百度發佈了集成個人搜索助理和智能聊天功能的度秘;2016年,谷歌發佈了智能聊天程序Google Allo;2017年1月,百度推出的基於自然語言對話的操作系統Duer OS則代表了國內互聯網公司在建立智能助理開發與應用平台方面的自信。

新聞推薦和新聞撰稿

用手機看熱點新聞是許多人每天都要做的事。像“今日頭條”這樣的新聞類應用之所以火爆,主要就是因為其採用了人工智能技術,應用程序可以聰明地歸納每個人看新聞時的不同習慣、愛好,給不同用戶推薦不同的新聞內容。帶智能推薦功能的應用如果做得好,用戶就會覺得,越經常使用,機器就越懂得自己的“心思”,一段時間後,這個應用程序就不亞於一個量身定制的新聞管家了。

而且,AI的魔力還不止於新聞推薦。你知道嗎,現在,相當數量的新聞內容,根本就是由計算機上的人工智能程序自動撰寫的!

2011年,一個名叫羅比·艾倫(Robbie Allen)的思科公司工程師將自己創辦的一家小公司改名為Automated Insights,這個新名字大有深意——羅比·艾倫立志研發人工智能自動寫作程序,而公司新名字的首字母縮寫恰好就是人工智能的英文縮寫——AI。

借助一套名為“作家”(Wordsmith)的人工智能技術平台,Automated Insights公司首先與美聯社等新聞機構合作,用機器自動撰寫新聞稿件。2013年,機器自動撰寫的新聞稿件數量已達3億篇,超過了所有主要新聞機構的稿件產出數量;2014年,Automated Insights的人工智能程序已撰寫出超過10億篇的新聞稿2。

世界三大通訊社之一的美聯社於2014年宣佈,將使用Automated Insights公司的技術為所有美國和加拿大上市公司撰寫營收業績報告。目前,每季度美聯社使用人工智能程序自動撰寫的營收報告數量接近3700篇,這個數量是同時段美聯社記者和編輯手工撰寫的相關報告數量的12倍3。2016年,美聯社將自動新聞撰寫擴展到體育領域,從美國職業棒球聯盟的賽事報道入手,大幅減輕人類記者和編輯的勞動強度。

想看看機器自動撰寫的新聞報道是否表達清晰,語句通暢?下面是從美聯社職業棒球聯盟新聞稿中節選出來的幾段:

賓夕法尼亞州立學院(美聯社):第十一局,一二三壘有人,一人出局的情況下,迪倫·蒂斯被觸身球擊中,保送上壘。這是本週三州立學院鹿角隊9︰8戰勝布魯克林旋風隊的比賽中的一幕。

丹尼·哈茨納通過犧牲打獲得制勝一分。擊球後,他成功跑上二壘但在跑向三壘時出局。

基恩·科恩在第一局中打出雙殺,使旋風隊以1︰0領先。但在第一局的隨後時間內,鹿角隊連得5分,其中,迪倫·蒂斯的觸身球就直接送兩人跑回本壘。

……4

自動撰寫新聞稿件的好處不言而喻,這不但可以節省記者和編輯的大量勞動,而且可以在應對突發事件時充分體現出計算機的“閃電速度”。

2014年3月17日清晨,仍在夢鄉的洛杉磯市居民被輕微的地面晃動驚醒。這是一次震級不大的地震,但因為震源較淺,市民的感受比較明顯。地震發生後不到三分鐘,《洛杉磯時報》就在網上發佈了一則有關這次地震的詳細報道,報道不但提及了地震台網觀測到的詳細數據,還回顧了舊金山區域最近十天的地震觀測情況5。

人們在新聞報道的網頁上看到了《洛杉磯時報》記者的姓名,但該新聞之所以能夠在如此快的時間裡發出,完全要歸功於可以不眠不休工作的人工智能新聞撰寫程序。地震發生的瞬間,計算機就從地震台網的數據接口中獲得了有關地震的所有數據,然後飛速生成英文報道全文。剛剛從睡夢中驚醒的記者一睜眼就看到了屏幕上的報道文稿,他快速審閱後用鼠標點擊了“發佈”按鈕。一篇自動生成並由人工覆核的新聞稿就這樣在第一時間快速面世。

機器視覺

人臉識別,這幾乎是目前應用最廣泛的一種機器視覺技術,是人工智能大家庭中的重要分支。近年來,隨著深度學習技術的發展,人工智能程序對人臉識別的準確率已經超過了人類的平均水平。

很多公司都為員工發放用於出入公司的門禁卡。但在我們的創新工場,沒有人佩戴門禁卡。創新工場的大門上裝有一個高分辨率的攝像頭,員工走近大門的過程裡,與攝像頭相連的計算機中安裝的一套名為Face++的智能軟件會實時採集人臉圖像並與系統中存儲的員工照片進行比對,系統認識的“熟人”可以自由通行,系統不認識的“陌生人”則會被拒之門外。

人臉識別不僅僅可以當保安、當門衛,還可以在手機上保證你的交易安全。不少手機銀行在需要驗證業務辦理人的身份時,會打開手機的前置攝像頭,要求你留下面部的實時影像,而智能人臉識別程序會在後台完成你的身份比對操作,確保手機銀行程序不會被非法分子盜用。

廣義上的機器視覺既包括人臉識別,也包括圖像、視頻中的各種物體識別、場景識別、地點識別乃至語義理解。所有這些智能算法目前都可以在普通手機應用中找到。

圖4 用谷歌照片檢索出我在2008年參加奧運火炬接力的瞬間

例如,今天主流的照片管理程序幾乎都提供了自動照片分類和檢索的功能。其中智能程度最高、功能最強大的非谷歌照片莫屬。利用谷歌照片,我可以把我的所有照片和視頻——沒錯,是所有照片和視頻,不管是昨天拍攝的晚宴照片,還是十幾年前為孩子拍攝的家庭錄像——統統上傳到雲端,不用進行任何手工整理、分類或標注,谷歌照片會自動識別出照片中的每一個人物、動物、建築、風景、地點,並在我需要時,快速給出正確的檢索結果。

利用谷歌照片,我可以輕鬆找到自己在過去若干年裡的每一個精彩瞬間,也可以瀏覽在過去一年裡我都去過哪些著名景點。或者,可以簡單輸入任何一種動物的名字,比如“海鷗”,看看我以前是不是為海鷗拍過照片。

圖5 用谷歌照片檢索出所有海鷗照片和視頻

AI藝術

2016年夏天,一款名為Prisma的手機繪畫程序在大家的朋友圈裡流行開來。Prisma並不是用程序憑空作畫,而是根據用戶指定的一張照片,將照片變成特定風格的畫作。

圖6中,我將一隻在北京近郊拍攝到的貓咪的照片(左上角照片)交給Prisma, Prisma利用先進的人工智能算法理解照片中貓咪身上的每一個色塊和每一處邊緣,然後將計算機從大量經典畫作中學習到的上色技法、筆觸技法、乾濕畫法等應用到這張真實的照片上。

圖6 Prisma在一隻貓的照片基礎上完成創作的結果

我們可以把整個過程看成一個學習繪畫的孩子對著一張貓咪照片進行的創作訓練。這個名叫Prisma的孩子曾受過嚴格的美術教育,臨摹過中西方大量經典名畫,可以熟練使用各種油畫、水彩畫乃至漫畫技法進行創作。以這張貓咪照片為基礎,Prisma在理解照片內容之後,可以用人工智能的“畫筆”藝術性地“創作”出多達二十幾種不同畫風的作品。

這種畫風遷移功能不僅僅可以幫助普通人進行“藝術創作”,還可以讓愛漂亮、愛自拍的女生把自己裝扮成通常只在動漫或夢境中才能見到的美少女形象。2017年1月,美圖秀秀推出的手繪自拍功能一夜“刷屏”,從中國到歐美再到日韓,上億用戶包括無數女明星在內,紛紛用手繪自拍功能將自己變成二次元世界裡超萌、超可愛的漫畫形象。英國《每日電訊報》報道說:“如果你突然在社交網絡上看到到處都是迷人的自拍,那麼你應該感謝這個來自中國的應用——美圖秀秀。”6

圖7 使用美圖秀秀的手繪自拍功能,連我也可以秒變小鮮肉

不只女生喜歡這個功能,其實,男生也可以用這個功能將自己美化成二次元世界裡最新鮮的小鮮肉。連我這個“大叔”在手繪自拍功能的強大藝術表現力之下,也被P成了粉嫩可愛的有趣形象。

新一代搜索引擎

搜索引擎裡也有人工智能?

在很多人眼中,搜索引擎是誕生於20世紀的一項互聯網核心技術。谷歌創始人拉裡·佩奇(Larry Page)和謝爾蓋·布林(Sergey Brin)於1996年提出的Page Rank算法大幅提升了搜索引擎結果排序的準確性,但二十餘年過去了,搜索引擎的技術、算法難道不是已經非常成熟了嗎?這裡還有人工智能發揮作用的空間嗎?

2016年2月的一天,谷歌高級副總裁、46歲的阿米特·辛格爾(Amit Singhal)宣佈離開谷歌搜索引擎核心團隊負責人的位置,接替他領導世界上最大搜索引擎的高級副總裁,是曾主管谷歌知識圖譜和機器學習兩大核心研發團隊的約翰·賈南德雷亞(John Giannandrea)。這起人事變動無論對谷歌內部還是對外界來說都意味深長,當時的許多媒體將此次人事更迭解讀為谷歌搜索全面由傳統算法向人工智能算法轉變的信號7。當然,直到2017年年初公眾才知曉,阿米特·辛格爾離職的更直接原因是他捲入了一樁性騷擾案8。但當時也許是被迫而為的高管更迭,卻從實際結果上體現出了谷歌搜索技術方向的深刻變革。

阿米特·辛格爾是谷歌搜索引擎早期核心算法,特別是網頁排序算法的最重要貢獻者。簡單地說,最傳統的網頁排序算法是找出所有影響網頁結果排序的因子,然後根據每個因子對結果排序的重要程度,用一個人為定義的、十分複雜的數學公式將所有因子串聯在一起,計算出每個特定網頁在最終結果頁面中的排名位置。

約翰·賈南德雷亞(在谷歌工作時,我們都親切地用姓名首字母稱呼他為JG)曾主管的知識圖譜和機器學習兩大研發團隊則代表了谷歌在人工智能領域的未來。其實,谷歌很早就開始用機器學習技術幫助搜索引擎完成結果排序。這一思路和傳統算法不同。在機器學習的方向裡,計算網頁排序的數學模型及模型中的每一個參數不完全是由人預先定義的,而是由計算機在大數據的基礎上,通過複雜的迭代過程自動學習得到的。影響結果排序的每個因子(在機器學習領域,每個影響因子也被稱為“特徵”)到底有多重要,或者如何參與最終的排名計算,主要由人工智能算法通過自我學習來確定。從2011年起,隨著深度學習技術的復興和谷歌大腦(Google Brain)項目的成功建設,谷歌搜索引擎使用的網頁排序算法越來越依賴於深度學習技術,網頁結果的相關性和準確度也由此得到了大幅提高。可以毫不誇張地說,到約翰·賈南德雷亞執掌谷歌搜索團隊的時候,谷歌搜索已經是一個絕大部分由人工智能技術支撐的新一代搜索引擎了。

圖8 向百度提問並直接得到答案

結果排名還只是人工智能技術在搜索引擎中應用的冰山一角。打開谷歌或類似的主流搜索引擎,人工智能的魔力無處不在。今天,我們可以直接在谷歌向搜索引擎提出問題,搜索引擎會聰明地給出許多知識性問題的答案。

圖9 向谷歌提問並直接得到答案

例如,在圖8中,我們可以直接向百度提問“東野圭吾多大了”,百度在結果頁的最顯著位置直接給出“58週歲”(2016年)的正確答案。我們甚至可以向谷歌提問:“在《哈利·波特》的系列故事裡,到底是誰殺了令人尊敬的校長鄧布利多?”谷歌不但直接給出殺害鄧布利多的兇手名字,還顯示出相關的電影劇照、故事情節、維基百科鏈接等。

近年來,利用人工智能技術在語音識別、自然語言理解、知識圖譜、個性化推薦、網頁排序等領域的長足進步,谷歌、百度等主流搜索引擎正從單純的網頁搜索和網頁導航工具,轉變成為世界上最大的知識引擎和個人助理——毫無疑問,人工智能技術讓搜索引擎變得更聰明了。

機器翻譯

打破語言界限,用自動翻譯工具幫助人類進行跨民族、跨語種、跨文化交流,這是人類自古以來就一直追尋的偉大夢想。1799年發現的羅塞塔石碑(Rosetta Stone)更是將這種交流推動到了跨時空的層面。借助羅塞塔石碑和語言學家的智慧,我們能夠讀懂數千年前的古埃及文字,瞭解古埃及人的所為、所思、所述,這真是一件無比奇妙的事。

圖10 羅塞塔石碑(©Hans Hillewaert, CC BY-SA 4.0,Wikipedia)

今天,雖然還不盡完美,基於人工智能技術的機器翻譯工具正幫助世界各地的人們交流和溝通。在所有流行的翻譯工具中,谷歌翻譯是支持語種最多,翻譯效果最好的。

2016年9月,谷歌宣佈已經在谷歌翻譯的中譯英的模型中應用了深度學習的一種最新算法,並大幅提高了中文到英文的翻譯準確率9。

圖11 谷歌翻譯2016年9月更新算法後的中譯英效果

圖11是谷歌翻譯2016年9月部署的最新算法對本書一個中文段落的翻譯結果。可以看到,機器翻譯的結果已經與人類的英文表達相當接近,除了一些用詞和句法處理有待斟酌外,整個英文段落已經具備了較強的可讀性,幾乎沒有什麼歧義或理解障礙。

2016年11月,谷歌又發表論文,宣佈已突破了跨語言翻譯的難題,可以在兩種沒有直接對應的語料樣本的語言之間,完成機器翻譯。舉例來說,如果我們沒法在網絡上收集到足夠多的中文和阿拉伯文之間的對應語料,那麼,谷歌的機器翻譯技術可以利用英文到阿拉伯文之間的對應語料,以及中文到英文之間的對應語料,訓練出一個支持多語言間相互翻譯的模型,完成中文和阿拉伯文的雙向翻譯。這種技術可以輕易將翻譯系統支持的語言對的數量,擴展到幾乎所有主要地球語言的相互配對組合。10

事實上,谷歌早年發展機器翻譯技術時,技術團隊就是將“羅塞塔石碑”用作機器翻譯產品的內部代號。數千年前的羅塞塔石碑,和21世紀的人工智能算法一道,正穿越漫長的時空隧道,為人類的順暢溝通而努力。

自動駕駛

毫無疑問,自動駕駛是最能激起普通人好奇心的人工智能應用領域之一。由計算機算法自動駕馭的汽車、飛機、宇宙飛船曾是絕大多數科幻小說中最重要的未來元素。想到未來某一天,我們可以不考駕照,不雇司機,直接向汽車發個命令,就能便捷出行,每個人都會興奮不已。但很多人似乎還沒有意識到,自動駕駛汽車本身,或至少是相關的科技成果其實已經在我們身邊發揮作用並創造巨大的商業價值了。

谷歌的自動駕駛技術在過去若干年裡始終處在領先地位,不僅獲得了在美國數個州合法上路測試的許可,也在實際路面上積累了上百萬英里的行駛經驗。但截至2016年年底谷歌自動駕駛團隊獨立出來,成立名為Waymo的公司時,遲遲沒有開始商業銷售的谷歌自動駕駛汽車似乎離普通人的生活還很遙遠。

相比谷歌的保守,特斯拉在推廣自動駕駛技術時就比較激進。早在2014年下半年,特斯拉就開始在銷售電動汽車的同時,向車主提供可選配的名為Autopilot的輔助駕駛軟件。計算機在輔助駕駛的過程中依靠車載傳感器實時獲取的路面信息和預先通過機器學習得到的經驗模型,自動調整車速,控制電機功率、制動系統以及轉向系統,幫助車輛避免來自前方和側方的碰撞,防止車輛滑出路面,這些基本技術思路與谷歌的自動駕駛是異曲同工的。

圖12 自動駕駛汽車的AI算法通過傳感器“看到”的實時路面情況11

當然,嚴格地來說,特斯拉的Autopilot提供的還只是“半自動”的輔助駕駛功能,車輛在路面行駛時,仍需要駕駛員對潛在危險保持警覺並隨時準備接管汽車操控。

2016年5月7日,一起發生在佛羅里達州的車禍是人工智能發展史上的第一起自動駕駛致死事故。當時,一輛開啟Autopilot模式的特斯拉電動汽車沒有對駛近自己的大貨車做出任何反應,逕直撞向了大貨車尾部的拖車並導致駕駛員死亡。

事故之後,特斯拉強調,在總計1.3億英里的Autopilot模式行駛記錄中,僅發生了這一起致死事故,據此計算的事故概率遠比普通汽車平均每9400萬英里發生一起致死事故的概率低。12同時,特斯拉也指出,事故發生時,由於光線、錯覺等原因,駕駛員和Autopilot算法都忽視了迎面而來的危險。2017年年初,美國國家公路交通安全管理局(NHTSA)出具調查報告,認為特斯拉的Autopilot系統不應對此次事故負責,因為該系統的設計初衷是需要人類駕駛員來監控路況並應對複雜情況。事故發生時,特斯拉的駕駛員有7秒鐘的時間對駛近的大貨車做出觀察和反應,可惜駕駛員卻什麼都沒有做。美國國家公路交通安全管理局同時還強調說,特斯拉在安裝了Autopilot輔助駕駛系統後,事故發生率降低了40%。13這表明,自動駕駛系統的總體安全概率要高於人類駕駛員,自動駕駛的商業化和大範圍普及只是時間的問題。

在消費者市場之外,自動駕駛技術也許很快就會在一些特定的行業市場落地。在出租行業,優步和滴滴這樣的領導者都在為自動駕駛技術用於共享經濟而積極佈局。優步的無人出租車已經在美國道路開始測試。在物流行業,自動駕駛的貨運汽車很可能早於通用型的自動駕駛汽車開始上路運營。一些研發團隊甚至憧憬過自動駕駛貨車在高速公路上結成編隊,快速、安全行駛的場面。而像馭勢科技這樣的小型初創公司,則提出了讓自動駕駛汽車首先進入較為獨立的社區道路,承擔起小區通勤任務的想法。

無疑,在谷歌、特斯拉等科技巨頭和傳統汽車廠商、新興創業公司等眾多參與者的努力下,自動駕駛本身的科幻色彩在今天已越來越弱——它正從科幻元素變成真真切切的現實。

機器人

機器人是人工智能另一個經常讓人浮想聯翩的技術領域。工業機器人開始在製造業中發揮作用已經是很多年前的新聞了。在主流的汽車生產線中,甚至在富士康的手機生產線中,不使用工業機器人才是新聞。

其實,另一種對普通人來說相對陌生的機器人反而與我們的生活關係更近。今天,在亞馬遜這種電子商務巨頭的庫房裡,在沃爾瑪的倉儲中心,成千上萬的機器人正代替人類完成繁重的商品擺放、整理,快速出庫、入庫等操作。

2012年,亞馬遜收購了一家名為Kiva的公司,收購的唯一目的就是獲取設計、製造倉儲機器人的能力。基於Kiva技術,亞馬遜大量製造一種橙黃色的小個子機器人,這些機器人可以自動馱著貨物轉運架,在亞馬遜的大型倉儲中心裡快速移動,將貨物運送到指定位置。

圖13 亞馬遜橙黃色的倉儲機器人14

根據2015年第三季度末的統計數據,亞馬遜在13個倉儲中心使用著超過3萬個Kiva機器人15。這些機器人不僅比人類倉庫管理員工作得更快、更有效率,而且在空間佔用上也比人類更為節省。使用了橙黃色機器人的倉儲中心比普通倉儲中心可以多存放50%的貨物,運營成本也由此降低了20%。

對於愛網購的新新人類而言,快遞是另一個與大家的幸福指數息息相關的行業。在這裡,機器人當然也可以大顯身手。例如,谷歌、亞馬遜、DHL等從幾年前就開始嘗試用智能無人機完成快遞流程的“最後一英里”。

圖14 DHL用於遞送快遞包裹的無人機16

除了可以直接落在自家庭院裡的無人機,不少初創公司也在大力研製智能機器人形式的無人貨運小車。比薩餅連鎖店達美樂就在嘗試用小車形狀的機器人上門送比薩。一家名為Starship Technologies的初創公司更是為小車形狀的機器人設計了安全鎖、智能行駛、精準定位、智能通信等模塊,小車最多可承載20磅(約9千克)貨物,最遠可在方圓1英里(約1.6千米)的範圍內運行,不僅僅可以充當快遞工具,還可以在你購物回家的路上幫你拿東西。

圖15 Starship Technologies的智能機器人17

另一個近年來火熱的領域是教育和家庭用機器人。不過必須提醒大家的是,今天的家庭機器人還遠無法像大家奢望的那樣,以人形外貌出現在主人面前。從投資者的角度看,越是追求與人長得一樣,試圖像人一樣說話、做事的機器人項目,就越沒有商業前景。這個道理很簡單——機器人越像人,人類就越容易拿真人與“它”做比較。這時,技術的不足會暴露無遺,在“缺點放大鏡”的作用下,這種機器人只會顯得無比愚蠢和笨拙。真正容易打動家庭用戶的是諸如亞馬遜Echo這樣的智能家電——功能相對簡單,外形更像家電而不是機器人,智能功能只面向一兩個有限但明確的使用場景。也就是說,大多數用戶會更喜歡一個有一定溝通能力、比較可愛甚至很“萌”的小家電,而不是一個處處缺陷的全功能人形機器人。

教育機器人也類似這樣。比如初創公司奇幻工房(Wonder Workshop)推出的名為達奇(Dash)和達達(Dot)的兩個小機器人,它們可以幫助5歲以上的孩子學習編程,開發孩子的動手能力和想像力,但它們的外貌並不像真人,而是幾個可愛的幾何形體組合。

圖16 奇幻工房的教育機器人達奇18

到底什麼是人工智能?

人工智能就在我們身邊,但並非所有人都能留意到它的存在。許多人只是將它視作尋常科技的一種——這牽涉到一個如何定義人工智能的問題。

在有些人眼裡,只有長相和人一模一樣,智慧水平不輸於18歲男女青年的機器才叫人工智能;可在另一些人看來,計算機能做許多人類做不到的事,比如一秒鐘完成數百億次運算,人類再聰明也無法在計算速度上與機器相比,為什麼就不能將遠超人類的計算機稱為人工智能呢?

這兩種看法幾乎是兩個極端。誰的看法更正確一些呢?

到底什麼是人工智能?為什麼我們說之前談到的智能搜索引擎、智能助理、機器翻譯、機器寫作、機器視覺、自動駕駛、機器人等技術屬於人工智能,而諸如手機操作系統、瀏覽器、媒體播放器等通常不被歸入人工智能的範疇?人工智能究竟有沒有一個容易把握和界定的科學定義?

AI小百科 人工智能的定義

歷史上,人工智能的定義歷經多次轉變。一些膚淺的、未能揭示內在規律的定義很早就被研究者拋棄。但直到今天,被廣泛接受的定義仍有很多種。具體使用哪一種定義,通常取決於我們討論問題的語境和關注的焦點。

這裡,簡要列舉幾種歷史上有影響的,或目前仍流行的人工智能的定義。對這些定義的分析、討論是一件相當有趣的事,這有些類似於古代哲學家們圍坐在一起探討“人何以為人”,或者,類似於科幻迷們對阿西莫夫的“機器人三定律”展開辯論。其實,很多實用主義者反對形而上的討論,他們會大聲說:“嘿,管它什麼是人工智能呢?只要機器能幫助人解決問題不就行了?”

定義一 AI就是讓人覺得不可思議的計算機程序

人工智能就是機器可以完成人們不認為機器能勝任的事——這個定義非常主觀,但也非常有趣。一個計算機程序是不是人工智能,完全由這個程序的所作所為是不是能讓人目瞪口呆來界定。這種唯經驗論的定義顯然缺乏一致性,會因時代不同、背景不同、評判者的經驗不同而套用不同的標準。但這一定義往往反映的是一個時代裡大多數的普通人對人工智能的認知方式:每當一個新的人工智能熱點出現時,新聞媒體和大眾總是用自己的經驗來判定人工智能技術的價值高低,而不管這種技術在本質上究竟有沒有“智能”。

計算機下棋的歷史就非常清楚地揭示了這一定義的反諷之處。

早期,礙於運行速度和存儲空間的限制,計算機只能用來解決相對簡單的棋類博弈問題,例如西洋跳棋,但這毫不妨礙當時的人們將一台會下棋的計算機稱作智能機器,因為那時,普通計算機在大多數人心目中不過是一台能用飛快的速度做算術題的機器罷了。1951年,英國曼徹斯特大學的克裡斯托弗·斯特拉齊(Christopher Strachey)編寫了第一個會下西洋跳棋的計算機程序。20世紀50年代中期,IBM的阿瑟·薩繆爾(Arthur Samuel)開發的西洋跳棋程序可以和業餘選手對抗。1962年,阿瑟·薩繆爾的程序戰勝了一位盲人跳棋高手,一時間成了不小的新聞事件19,絕大多數媒體和公眾都認為類似的西洋跳棋程序是不折不扣的人工智能。

可沒過多久,不少粗通編程的人發現,計算機基本上是在用搜索或優化搜索的方式來解決博弈問題。雖然其中有各種避免窮舉的算法技巧,但在公眾眼中,程序只不過是按事先編寫的搜索策略一步步找到最佳走棋步驟而已。隨著PC的普及,每台個人電腦都可以運行一個水平相當高的西洋跳棋程序,會下棋的計算機逐漸褪去了神秘的光環。人們開始懷疑西洋跳棋程序的智能程度,不少人會用國際象棋作為例子,挑釁式地說:“下西洋跳棋有什麼了不起?哪天在國際象棋棋盤上贏了世界冠軍,那才叫人工智能。”

後面的事情大家都很熟悉了。1996年,IBM研究團隊傾力打造的計算機深藍挑戰世界棋王卡斯帕羅夫,當年雖遺憾敗北,但人們已經看到了計算機戰勝人類的希望。1997年,深藍捲土重來,在六局棋的對抗賽中戰勝卡斯帕羅夫後聲譽大振。當時,幾乎全世界的人都在討論深藍的強大和可怕,沒人懷疑深藍就是人工智能的代表,至少,公眾願意相信,在深藍巨大的黑色機箱內,擁有一顆在棋類博弈領域不輸人類的特殊“大腦”。

好景不長,與西洋跳棋相似的歷史很快就再次上演。當國際象棋、中國象棋已經被計算機玩得滾瓜爛熟,連一部手機、一台平板電腦上的象棋程序都能與人類高手分庭抗禮時,公眾立即開始懷疑這樣的博弈程序是不是還算得上人工智能。事實上,與下棋類似的事情也發生在OCR(光學字符識別)等已經失去了新鮮感的計算機算法身上20。道理很簡單,公眾總是樂於證明人類在智慧層面的獨一無二。不管是不是真的懂得算法細節,人們總會說,計算機只不過是在程序控制下機械地完成搜索或窮舉罷了。

拒絕承認象棋程序是人工智能後,公眾找到了維護人類智慧尊嚴的最後陣地——圍棋。直到2016年年初,除了一個叫樊麾的職業圍棋選手和谷歌Deep Mind的一支規模不大的研發團隊外,幾乎所有地球人,包括圍棋高手和不少計算機專家都經常會說:“下象棋有什麼了不起?真有智能的話,來跟世界冠軍下盤圍棋試試?圍棋可是一項無法窮盡搜索,需要依靠人類大局觀的智力運動,是唯一一種計算機無法戰勝人類的棋類比賽。”

很不幸,人類的自以為是又一次被快速發展的人工智能算法無情嘲笑了。2016年3月9日,圍棋世界冠軍李世石坐在Alpha Go面前,宿命再一次降臨。隨著Alpha Go在五番棋中以四比一大勝,有關人工智能的熱情和恐慌情緒同時在全世界蔓延開來,也因此引發了一撥人工智能的宣傳熱潮。

2017年元旦前後,升級版的Alpha Go更是以Master的網名悄然復出,在對弈平台上,與包括中日韓最高水平棋手在內的數十位人類頂尖棋手過招,弈出了60︰0的絕對優勢戰績,可謂笑傲棋壇,但求一敗。

今天,沒有人懷疑Alpha Go的核心算法是人工智能。但想一想曾經的西洋跳棋和國際象棋,當時的人們不是一樣對戰勝了人類世界冠軍的程序敬若神明嗎?再過兩三年,當手機上的圍棋程序可以輕鬆戰勝職業棋手,當所有圍棋比賽都要嚴查手機作弊時,人們還會認為計算機下圍棋是一件不可思議的事嗎?人們還會將圍棋程序視為人工智能的代表嗎?

定義二 AI就是與人類思考方式相似的計算機程序

這是人工智能發展早期非常流行的一種定義方式。另一種類似的,同樣從思考方式本源出發的定義是:AI就是能遵照思維裡的邏輯規律進行思考的計算機程序。

從根本上講,這是一種類似仿生學的直觀思路。既然叫人工智能,那用程序來模擬人的智慧就是最直截了當的做法。但歷史經驗證明,仿生學的思路在科技發展中不一定可行。一個最好也最著名的例子就是飛機的發明。在幾千年的時間裡,人類一直夢想著按照鳥類扑打翅膀的方式飛上天空,但反諷的是,真正帶著人類在長空翱翔,並打破了鳥類飛行速度、飛行高度紀錄的,是飛行原理與鳥類差別極大的固定翼飛機。

人類思考方式?人究竟是怎樣思考的?這本身就是一個複雜的技術和哲學問題。要瞭解人類自身的思考方式,哲學家們試圖通過反省與思辨,找到人類思維的邏輯法則,而科學家們則通過心理學和生物學實驗,瞭解人類在思考時的身心變化規律。這兩條道路都在人工智能的發展歷史上起到過極為重要的作用。

思維法則,或者說,邏輯學,是一個人的思考過程是不是理性的最高判定標準。從古希臘的先賢們開始,形式邏輯、數理邏輯、語言邏輯、認知邏輯等分支在數千年的積累和發展過程中,總結出大量規律性的法則,並成功地為幾乎所有科學研究提供了方法論層面的指導。讓計算機中的人工智能程序遵循邏輯學的基本規律進行運算、歸納或推演,是許多早期人工智能研究者的最大追求。

世界上第一個專家系統程序Dendral是一個成功地用人類專家知識和邏輯推理規則解決一個特定領域問題的例子。這是一個由斯坦福大學的研究者用Lisp語言寫成的,幫助有機化學家根據物質光譜推斷未知有機分子結構的程序。Dendral項目在20世紀60年代中期取得了令人矚目的成功,衍生出一大批根據物質光譜推斷物質結構的智能程序21。Dendral之所以能在限定的領域解決問題,一是依賴於化學家們積累的有關何種分子結構可能產生何種光譜的經驗知識,二是依賴符合人類邏輯推理規律的大量判定規則。Dendral的成功事實上帶動了專家系統在人工智能各相關領域的廣泛應用,從機器翻譯到語音識別,從軍事決策到資源勘探。一時間,專家系統似乎就是人工智能的代名詞,其熱度不亞於今天的深度學習。

但人們很快就發現了基於人類知識庫和邏輯學規則構建人工智能系統的局限。一個解決特定的、狹小領域問題的專家系統很難被擴展到稍微寬廣一些的知識領域中,更別提擴展到基於世界知識的日常生活裡了。一個著名的例子是早期人們用語法規則與詞彙對照表來實現機器翻譯時的窘境。1957年蘇聯發射世界上第一顆人造衛星後,美國政府和軍方急於使用機器翻譯系統瞭解蘇聯的科技動態。但用語法規則和詞彙對照表實現的俄語到英語的機器翻譯系統笑話百出,曾把“心有餘而力不足”(the spirit is willing but the flesh is weak)翻譯為“伏特加不錯而肉都爛掉了”(the vodka is good but the meat is rotten),完全無法處理自然語言中的歧義和豐富多樣的表達方式22。在後起的統計模型、深度學習等技術面前,專家系統毫無優勢可言,因而從20世紀90年代開始就備受冷落。科研機構甚至不得不解雇過時的語言學家,以跟上技術發展的腳步。

另一方面,從心理學和生物學出發,科學家們試圖弄清楚人的大腦到底是怎麼工作的,並希望按照大腦的工作原理構建計算機程序,實現“真正”的人工智能。這條道路上同樣佈滿荊棘。最跌宕起伏的例子,非神經網絡莫屬。

生物學家和心理學家很早就開始研究人類大腦的工作方式,其中最重要的一環,就是大腦神經元對信息(刺激)的處理和傳播過程。早在通用電子計算機出現之前,科學家們就已經提出了有關神經元處理信息的假想模型,即人類大腦中的數量龐大的神經元共同組成一個相互協作的網絡結構,信息(刺激)通過若干層神經元的增強、衰減或屏蔽處理後,作為系統的輸出信號,控制人體對環境刺激的反應(動作)。20世紀50年代,早期人工智能研究者將神經網絡用於模式識別,用計算機算法模擬神經元對輸入信號的處理過程,並根據信號經過多層神經元後得到的輸出結果對算法參數進行修正。

早期神經網絡技術沒有發展太久就陷入低谷。這主要有兩個原因:一是當時的人工神經網絡算法在處理某些特定問題時有先天局限,亟待理論突破;二是當時的計算機運算能力無法滿足人工神經網絡的需要。20世紀70年代到80年代,人工神經網絡的理論難題得到解決。20世紀90年代開始,隨著計算機運算能力的飛速發展,神經網絡在人工智能領域重新變成研究熱點。但直到2010年前後,支持深度神經網絡的計算機集群才開始得到廣泛應用,供深度學習系統訓練使用的大規模數據集也越來越多。神經網絡這一仿生學概念在人工智能的新一輪復興中,真正扮演了至關重要的核心角色。

客觀地說,神經網絡到底在多大程度上精確反映了人類大腦的工作方式,這仍然存在爭議。在仿生學的道路上,最本質的問題是,人類至今對大腦如何實現學習、記憶、歸納、推理等思維過程的機理還缺乏認識,況且,我們並不知道,到底要在哪一個層面(大腦各功能區相互作用的層面?細胞之間交換化學物質和電信號的層面?還是分子和原子運動的層面?)真實模擬人腦的運作,才能製造出可以匹敵人類智慧的智能機器。

定義三 AI就是與人類行為相似的計算機程序

和仿生學派強調對人腦的研究與模仿不同,實用主義者從不覺得人工智能的實現必須遵循什麼規則或理論框架。“黑貓白貓,逮住耗子的就是好貓。”在人工智能的語境下,這句話可以被改成:“簡單程序,複雜程序,聰明管用的就是好程序。”

也就是說,無論計算機以何種方式實現某一功能,只要該功能表現得與人在類似環境下的行為相似,就可以說,這個計算機程序擁有了在該領域內的人工智能。這一定義從近似於人類行為的最終結果出發,忽視達到這一結果的手段。另一種對人工智能的近似定義則更強調人工智能的實用色彩:AI就是可以解決問題並獲得最大收益的計算機程序。

略懂些編程的人都知道,幾乎所有程序設計語言都提供了類似“if……else……”的分支結構,即,如果程序發現某個條件已滿足,就執行if之後的指令,否則就執行else之後的指令。那麼,與“if……else……”相關的一個哲學問題是,程序根據某個條件進行判斷並完成相應操作的時候,這個“判斷”以及隨後的“決定”是由計算機自己做出的,還是由編程序的人做出的?如果是由計算機自己做出的,那能不能說所有執行了“if……else……”語句的計算機程序都是人工智能?如果相反,那計算機根據運行時的情況做決策時,人又在哪裡呢?

哲學思辨容易陷入這樣的兩難境地,但實用主義者根本不把這當回事——執行“if……else……”的程序是否有智能,完全要看那個程序是不是做了和人相似的有智能的事。像Dendral這樣的專家系統就是靠大量“if……else……”來模仿人類專家的判定規則,這當然屬於人工智能的範疇,而普通的數值計算程序即便用了“if……else……”,也不能被稱作智能。

實用主義者推崇備至的一個例子是麻省理工學院於1964年到1966年開發的“智能”聊天程序ELIZA。這個程序看上去就像一個有無窮耐心的心理醫生,可以和無聊的人或需要談話治療的精神病人你一句我一句永不停歇地聊下去。當年,ELIZA的聊天記錄讓許多人不敢相信自己的眼睛。可事實上,ELIZA所做的,不過是在用戶輸入的句子裡,找到一些預先定義好的關鍵詞,然後根據關鍵詞從預定的回答中選擇一句,或者簡單將用戶的輸入做了人稱替換後,再次輸出,就像心理醫生重複病人的話那樣。ELIZA心裡只有詞表和映射規則,它才不懂用戶說的話是什麼意思呢。

這種實用主義的思想在今天仍有很強的現實意義。比如今天的深度學習模型在處理機器翻譯、語音識別、主題抽取等自然語言相關的問題時,基本上都是將輸入的文句看成由音素、音節、字或詞組成的信號序列,然後將這些信號一股腦塞進深度神經網絡裡進行訓練。深度神經網絡內部,每層神經元的輸出信號可能相當複雜,複雜到編程者並不一定清楚這些中間信號在自然語言中的真實含義,但沒有關係,只要整個模型的最終輸出滿足要求,這樣的深度學習算法就可以工作得很好。在研究者看來,深度學習模型是不是真的跟人類大腦神經元理解自然語言的過程類似,這一點兒都不重要,重要的是,整個模型可以聰明地工作,最終結果看起來就像人做的一樣。

定義四 AI就是會學習的計算機程序

沒有哪個完美主義者會喜歡這個定義。這一定義幾乎將人工智能與機器學習等同了起來。但這的確是最近這撥人工智能熱潮裡,人工智能在許多人眼中的真實模樣。誰讓深度學習一枝獨秀,幾乎壟斷了人工智能領域裡所有流行的技術方向呢?

20世紀80年代到90年代,人們還在專家系統和統計模型之間搖擺不定,機器學習固守著自己在數據挖掘領域的牢固陣地遠遠觀望。從2000年到2010年,短短十幾年過去,機器學習開始逐漸爆發出驚人的威力,並最早在計算機視覺領域實現了驚人的突破。2010年至今,使用深度學習模型的圖像算法在Image Net競賽中顯著降低了對象識別、定位的錯誤率。2015年,Image Net競賽中領先的算法已經達到了比人眼更高的識別準確率23。就在同一年,語音識別依靠深度學習獲得了大約49%的性能提升24。機器翻譯、機器寫作等領域也在同一時期逐漸被深度學習滲透,並由此獲得了大幅改進。

“無學習,不AI”,這幾乎成了人工智能研究在今天的核心指導思想。許多研究者更願意將自己稱為機器學習專家,而非泛泛的人工智能專家。谷歌的Alpha Go因為學習了大量專業棋手棋譜,然後又從自我對弈中持續學習和提高,因此才有了戰勝人類世界冠軍的本錢。微軟的小冰因為學習了大量互聯網上的流行語料,才能用既時尚,又活潑的聊天方式與用戶交流。媒體上,被宣傳為人工智能的典型應用大多都擁有深度學習的技術基礎,是計算機從大量數據資料中通過自我學習掌握經驗模型的結果。

這一定義似乎也符合人類認知的特點——沒有哪個人是不需要學習,從小就懂得所有事情的。人的智慧離不開長大成人過程裡的不間斷學習。因此,今天最典型的人工智能系統通過學習大量數據訓練經驗模型的方法,其實可以被看成是模擬了人類學習和成長的全過程。如果說人工智能未來可以突破到強人工智能甚至超人工智能的層次,那從邏輯上說,在所有人工智能技術中,機器學習最有可能扮演核心推動者的角色。

當然,機器目前的主流學習方法和人類的學習還存在很大的差別。舉個最簡單的例子:目前的計算機視覺系統在看過數百萬張或更多自行車的照片後,很容易辨別出什麼是自行車,什麼不是自行車,這種需要大量訓練照片的學習方式看上去還比較笨拙。反觀人類,給一個三四歲的小孩子看一輛自行車之後,再見到哪怕外觀完全不同的自行車,小孩子也十有八九能做出那是一輛自行車的判斷。也就是說,人類的學習過程往往不需要大規模的訓練數據。這一差別給人類帶來的優勢是全方位的。面對繁紛複雜的世界,人類可以用自己卓越的抽像能力,僅憑少數個例,就歸納出可以舉一反三的規則、原理,甚至更高層次上的思維模式、哲學內涵等。最近,儘管研究者提出了遷移學習等新的解決方案,但從總體上說,計算機的學習水平還遠遠達不到人類的境界。

如果人工智能是一種會學習的機器,那未來需要著重提高的,就是讓機器在學習時的抽像或歸納能力向人類看齊。

定義五 AI就是根據對環境的感知,做出合理的行動,並獲得最大收益的計算機程序

針對人工智能,不同的定義將人們導向不同的研究或認知方向,不同的理解分別適用於不同的人群和語境。如果非要調和所有看上去合理的定義,我們得到的也許就只是一個全面但過於籠統、模糊的概念。

維基百科的人工智能詞條採用的是斯圖亞特·羅素(Stuart Russell)與彼得·諾維格(Peter Norvig)在《人工智能:一種現代的方法》25一書中的定義,他們認為:

人工智能是有關“智能主體(Intelligent agent)的研究與設計”的學問,而“智能主體是指一個可以觀察週遭環境並做出行動以達致目標的系統”26。

基本上,這個定義將前面幾個實用主義的定義都涵蓋了進去,既強調人工智能可以根據環境感知做出主動反應,又強調人工智能所做出的反應必須達致目標,同時,不再強調人工智能對人類思維方式或人類總結的思維法則(邏輯學規律)的模仿。

以上,我們列舉了五種常見的人工智能的定義。其中,第二種定義(與人類思考方式相似)特別不可取。人們對大腦工作機理的認識尚淺,而計算機走的是幾乎完全不同的技術道路。正如深度學習“三巨頭”之一的揚·勒丘恩(Yann Le Cun)所說,對深度神經網絡,“我最不喜歡的描述是‘它像大腦一樣工作’,我不喜歡人們這樣說的原因是,雖然深度學習從生命的生物機理中獲得靈感,但它與大腦的實際工作原理差別非常非常巨大。將它與大腦進行類比給它賦予了一些神奇的光環,這種描述是危險的。這將導致天花亂墜的宣傳,大家在要求一些不切實際的事情。人工智能之前經歷了幾次寒冬就是因為人們要求了一些人工智能無法給予的東西”27。國內著名機器學習專家、南京大學教授周志華則說:“現在有很多媒體,常說深度學習是‘模擬人腦’,其實這個說法不太對。我們可以說從最早的神經網絡受到一點點啟發,但完全不能說是‘模擬人腦’之類的。”28

第一種定義(讓人覺得不可思議)揭示的是大眾看待人工智能的視角,直觀易懂,但主觀性太強,不利於科學討論。第三種定義(與人類行為相似)是計算機科學界的主流觀點,也是一種從實用主義出發,簡潔、明瞭的定義,但缺乏周密的邏輯。第四種定義(會學習)反映的是機器學習特別是深度學習流行後,人工智能世界的技術趨勢,雖失之狹隘,但最有時代精神。第五種定義(維基百科使用的綜合定義)是學術界的教科書式定義,全面均衡,偏重實證。

基本上,偏重實證是近年來人工智能研究者的主流傾向。在今天這個結果至上的時代裡,沒有多少人願意花心思推敲人工智能到底該如何定義。有那個時間,還不如去搞幾個深度學習的新模型,發幾篇深度學習新算法的論文來得划算。