讀古今文學網 > 人工智能:李開復談AI如何重塑個人、商業與社會的未來圖譜 > 第五章 機遇來臨:AI先行的創新與創業 >

第五章 機遇來臨:AI先行的創新與創業

大多數情況下,人工智能並不是一種全新的業務流程或全新的商業模式,而是對現有業務流程、商業模式的根本性改造。AI重在提升效率,而非發明新流程、新業務。未來10年,不僅僅是高科技領域,任何一個企業,如果不盡早為自己的業務流程引入“AI+”的先進思維方式,就很容易處於落後的追隨者地位。

大時代,大格局

人工智能來了,普通公眾看到的是智能應用的驚艷,科技公司看到的是大勢所趨的必然,傳統行業看到的是產業升級的潛力,國家層面看到的是技術革命的未來。

AI時代,有AI大格局。我們可以不關心科幻影視中的機器人,卻無法不正視今天的AI技術對產業、經濟、社會乃至人類生活的巨大影響。

500年前,在航海大發現以及後來的工業革命時代選擇閉關鎖國的,後來大都因科技落後而被列強的堅船利炮敲破了國門。40年前,在個人電腦大發展時期錯過了集成電路、操作系統、辦公軟件、數據庫軟件等技術機會的,只能眼看著英特爾、微軟、IBM等公司佔據技術制高點。10年前,如果在移動互聯網的風口中錯過了桌面平台到移動平台的轉型,就只能在手機芯片及整機、移動電商、移動社交、移動搜索、O2O、手游等巨大商機前懊悔莫及。

今天,“互聯網+”的理念已經向各行業、各應用的縱深不斷滲透、落地,逐漸積累起來的高質量大數據為許多前沿行業打下了全面運用人工智能的基礎。我們有理由說,“AI+”或“+AI”的模式已經步入蓬勃發展的大好時機。

大多數情況下,人工智能並不是一種全新的業務流程或全新的商業模式,而是對現有業務流程、商業模式的根本性改造。AI重在提升效率,而非發明新流程、新業務。未來10年,不僅僅是高科技領域,任何一個企業,如果不盡早為自己的業務流程引入“AI+”的先進思維方式,就很容易處於落後的追隨者地位。

AI將成為國家科技戰略的核心方向

2016年11月,第三屆世界互聯網大會在烏鎮召開。名為互聯網大會,但從議程的設置以及媒體報道的關注熱點來看,這幾乎已經是一屆“人工智能大會”了。例如,大會的分論壇設置就有智慧醫療、智能出行等主題,都與人工智能相關。而作為時下互聯網最核心的領域——移動互聯網所在的分論壇幾乎完全被人工智能相關的演講“佔領”。我們不妨來看一看官方發佈的11月17日移動互聯網論壇的議程134:

瞧,90%以上的話題都是——人工智能!如果說未來的移動互聯網就是“AI+”的移動互聯網,恐怕一點兒都不為過吧。

其實,對人工智能大趨勢、大格局的重視已經開始從社會層面上升到國家層面。2016年5月,國家發改委、科技部、工業和信息化部、中央網信辦就聯合制定了《“互聯網+”人工智能三年行動實施方案》135。2017年3月,第十二屆全國人民代表大會第五次會議所做的政府工作報告更是明確提出,國家將加快人工智能等新興產業的技術研發和轉化。

在國家層面進行人工智能發展的戰略規劃和佈局,這絕不是一件過於超前的事。人工智能發展涉及科研向產業轉化的諸多挑戰,在各行業應用AI提高生產效率、改進生產流程也需要更高層面的信息共享和整體規劃,未來因人工智能引發的產業革命則亟待新一代教育體制、人才培養與再培訓機制、新的社會保障體系等的建立和完善。單靠企業或社會的力量,這些全局層面的問題是很難得到快速解決的。

2016年,關注全球人工智能發展態勢的朋友一定會注意到,這一年幾乎成了人工智能的“戰略報告年”,從科研機構到咨詢公司,從民間到政府,我們看到了許多份重量級的AI報告。

2016年9月,成立於2014年的斯坦福大學人工智能百年研究項目組發佈了首份人工智能報告——《2030年的人工智能與生活》136。這個研究項目組包括17名成員,由人工智能學術界、公司實驗室,以及產業界的專家與瞭解人工智能的法律、政治科學、政治及經濟方面的學者組成。他們計劃在持續至少100年的時間內,跟蹤和預測人工智能產業的發展。《2030年的人工智能與生活》是這個百年計劃發佈的第一份報告137。

斯坦福大學這份報告首先列舉了當前的人工智能熱門研究領域,包括大規模機器學習、深度學習、強化學習、機器人、計算機視覺、自然語言處理、協同系統、眾包和人類計算、算法博弈理論與計算機社會選擇、物聯網(IOT)、神經形態計算等。然後,報告概要分析了人工智能在2030年時最可能的應用場景,例如,包括智能汽車、交通規劃、即時交通、人機交互等技術變革在內的交通應用,家庭服務機器人領域的應用,人工智能輔助的醫療應用,智能教育應用,在資源匱乏的社區內的應用,公共安全與防護方向的應用,就業與勞資關係,娛樂類應用,等等,並為政府和社會決策提供了一些政策性的建議。

2016年12月,高盛公司發佈了長達百頁的人工智能生態報告——《人工智能,機器學習和數據是未來生產力的源泉》138。作為金融服務、投資和戰略咨詢行業的頂級企業,高盛公司當然深知AI對於產業變革和經濟走勢的戰略意義。他們這份報告的重點在於人工智能對經濟發展的影響和人工智能時代的投資機會。高盛認為,人工智能在四個方面的影響力最為顯著:

·生產率。根據高盛首席經濟學家簡·哈祖斯(Jan Hatzius)所說:“大體上而言,AI看起來似乎比上一次創新浪潮更有可能在統計數據中捕捉到更有價值的東西,人工智能可以降低成本,減少對高附加值生產類型的勞動投 入。”

·尖端技術。AI和機器學習在速度上的價值有利於構建一種在建設數據中心和網絡服務時讓硬件更便宜的趨勢。

·競爭優勢。我們看到了AI和機器學習具有重新調整每個行業的競爭秩序的潛力。未能投資和利用這些技術的管理團隊在和受益於戰略智能的企業競爭時,有很大的可能會被淘汰掉,因為這些技術可以讓企業的生產力提高,並為它們創造資本效益。

·創辦新公司。我們發現了150多家在過去10年中創建的人工智能和機器學習公司。雖然我們相信人工智能的大部分價值都掌握在具有資源、數據和投資能力的大公司手中,但我們也期望風險投資家、企業家和技術專家可以繼續推動新公司的創立,從而促進實質性的創新和價值創造,即使最後創業公司會被收購。

美國政府也不甘落後。2016年10月至12月,美國白宮科技政策辦公室連續發佈了三份人工智能戰略報告,分別是《為未來人工智能做好準備》《國家人工智能研究與發展策略規劃》和《人工智能、自動化與經濟》139。

白宮認為,生產率增速放緩和收入增速放緩的問題正困擾著大部分發達國家,而人工智能驅動的自動化技術,是進一步釋放生產力,全面提升全要素生產率增長,並廣泛提高美國人的收入與生活水平的關鍵。考慮到人工智能已經進入一個最為重要的發展時期,美國政府需要為科研、產業、教育等領域的相關發展提供一個戰略方向上的指導。為此,《國家人工智能研究與發展策略規劃》140提出了七個重點戰略方向:

·策略1:對人工智能研發進行長期投資。將投資重點瞄準在下一代人工智能技術上,推動發現和深入瞭解,確保美國在人工智能領域始終居於世界領先地位。

·策略2:開發有效的“人—人工智能”協作方式。大部分人工智能系統將通過與人類合作來實現最佳績效,而非代替人類。需要開展充分研究,從而達到人與人工智能系統間的有效交互。

·策略3:理解並應對人工智能帶來的倫理、法律和社會影響。我們期望所有人工智能技術能夠遵循和人類相同的正式與非正式道德標準。研究理解人工智能的倫理、法律和社會影響,並開發用於設計與倫理、法律和社會目標一致的人工智能研發方法。

·策略4:確保人工智能系統的安全。在人工智能系統廣泛應用之前,需要確保系統能以可控的、明確的、已充分理解的方式安全操作。需要深入研究以應對人工智能系統所存在的威脅,設計可靠、可依賴、可信任的系統。

·策略5:開發人工智能共享公共數據集和測試環境平台。訓練數據集的資源的深度、質量和準確度極大地影響人工智能的性能。研究人員需要開發高質量數據集和環境,並使可靠訪問高質量數據集以及測試和培訓資源成為可能。

·策略6:建立標準和基準評估人工智能技術。標準、基準、試驗平台和社會參與是人工智能進步的基礎,它們將指導及評估人工智能的進展。需要進一步的研究以形成一系列可評估技術。

·策略7:更好地瞭解國家對人工智能研發人才的需求。人工智能的發展需要一支強勁的人工智能研究團隊。要更好地瞭解當前及未來人工智能研發對人才的需要,以確保有足夠的人工智能專家應對計劃中概述的戰略研發任務。

白宮發佈的三份人工智能報告,無論從深度和廣度上都值得其他國家科技戰略規劃人員研究。不過,從另一個角度來說,美國政府在產業發展中所起到的作用歷來有限。歷史上,發生在美國的歷次技術革命更多都是由科研機構或企業主導,而非政府主導。奧巴馬在任時的白宮科技政策辦公室在特朗普上台後,到底還有多少政策持續性,更是值得懷疑。

《人工智能時代》的作者傑瑞·卡普蘭就完全不相信美國政府發佈的所謂戰略規劃能有多大的約束力。傑瑞·卡普蘭介紹說,許多年以前,美國啟動了一個叫作“第五代計算機”的項目。日本政府也認為他們需要做類似的事情。政府認為他們可以主持建造所謂的第五代計算機——擁有大量CPU單元以提高性能的計算機。美國政府一度大力推動計劃的實施,但這個計劃從未變成現實。日本政府所做的類似努力讓日本經濟倒退了好幾年,因為他們投入了數十億美元卻收效甚微。2009年,奧巴馬總統啟動了一個投資太陽能的項目。政府決定去做投資,我認為這是一件好事情。政府在不同公司投入了資金。在這些公司裡,有一家叫Solyndra的公司拿到了5億美元的投資,其中大多數來自政府。但這家公司在2011年倒閉了。當時,政府和民主黨飽受批評。奧巴馬總統的聲譽遭受嚴重打擊,因為是他推動設立了這個項目。能源工業在這些公司身上投入巨資,卻因此而損失了數億美元。141

傑瑞·卡普蘭認為,當我們看到美國政府的類似計劃時,我們必須持一種懷疑的態度。美國所謂的政策,很多時候不過是一群擁有美好願望的人召開了一次政府會議,並發佈了一些相關文件。這些東西通常並不具有約束力。白宮能做的事情非常有限。他們必須勸說工業界,勸說人們去做這件事。中國的公眾看到美國公佈了什麼人工智能國家戰略,也許會很焦慮。中國公眾會想,我們也需要在這個領域做些什麼,因為美國政府認為這很重要。但是,這種報告和政府聲明在美國和中國的意義截然不同。中國政府擁有比美國政府強大得多的能力來將計劃付諸行動。

顯然,在討論所謂“國家科技戰略”的時候,我們需要認清不同國家在制定、實施相關政策時不同的角色和行動能力。對中國來說,政府和整個社會一向注重科技發展。今天是一個最好的將AI提升到科技發展戰略層面,加強全社會協作與資源共享,發揮人才優勢,快速佔領AI產業制高點的機會。

從谷歌的“AI先行”看科技企業的AI戰略

假如在互聯網公司裡找一家總是引領科技潮流的“前沿標桿”,那很多人都會想到谷歌。這絕不是因為谷歌有免費的美食和樂園一般的辦公環境。谷歌之所以為谷歌,最重要的是,無論在哪一次重大的技術變革中,谷歌幾乎都能敏銳地捕捉到先機,早早建立起領先競爭對手一兩年乃至三五年的巨大技術優勢。

當年,在移動互聯網還在襁褓之中的時候,谷歌高層就極為重視,連續通過自研與收購相結合,為移動互聯網打造了Android操作系統和Chrome瀏覽器兩大基礎平台。2009年前後,當i Phone手機和Android手機剛剛出現在普通人視野之中的時候,谷歌內部就要求大家按照“移動先行”(Mobile First)的戰略來安排產品設計和技術佈局,包括最核心的搜索引擎、地圖、You Tube等在內的全系列產品早早就與移動應用場景接軌。拿產品用戶界面來說,早在移動用戶占比還不足全部流量的40%時,谷歌內部就要求所有產品的用戶界面必須重點適配當時還特別狹小的手機屏幕——這一決策對谷歌產品的全面“移動化”至關重要。

要知道,在移動互聯網時代,評論者經常嘲笑谷歌錯失社交網絡的絕好機遇,也經常揶揄谷歌連續關停Google Reader等人氣產品。如果只看具體的應用級產品,谷歌在移動互聯網時代的表現確實毀譽參半。但如果上升到戰略層面,那麼,谷歌對互聯網技術大格局的認知之早、把握之準,實在是傲視同儕,比競爭對手高明太多。這就是谷歌能夠順利跨越互聯網到移動互聯網的轉型關口,始終保持全球領先優勢的原因所在。

同樣地,這一次人工智能熱潮到來之前,谷歌早早就做好了技術積累與鋪墊。早在我剛加入谷歌、開始創立谷歌中國的2005年,谷歌研究部門的總監彼得·諾維格(他也是《人工智能:一種現代的方法》的作者)就在谷歌中心園區的43號樓舉辦了一個每週一次的機器學習課程。那時,在谷歌內部的研究團隊和工程團隊裡,依賴機器學習技術解決實際問題的場景還不算多。但彼得·諾維格的課程已經吸引了包括大牛傑夫·迪恩在內的許多工程師,每次講課都濟濟一堂,課程還被錄成視頻,在谷歌全世界的幾十個辦公室傳播。

圖54 深度學習在谷歌內部項目中的應用呈現迅速遞增的態勢142

2006年到2010年,深度學習在理論和實際應用上連續取得里程碑式的突破。對技術極為敏感的谷歌研究員和工程師幾乎在第一時間注意到了技術革命的曙光。傑夫·迪恩帶領谷歌內部最為精幹的技術團隊,開始打造神秘的谷歌大腦——這絕對是高科技公司內部第一次基於深度學習理論,建立如此大規模的分佈式計算集群。谷歌大腦的意義,絕不僅僅是打造了一個可以進行深度學習計算的高性能平台這麼簡單。實際上,隨著谷歌大腦成為谷歌內部越來越多技術項目的基石,谷歌也自然而然地喊出了“AI先行”(AI First)的戰略口號。

從2012年到2015年,谷歌內部使用深度學習(絕大多數都依賴於谷歌大腦)的項目數量從零迅猛增長到一千多個。隨著谷歌Tensor Flow深度學習框架的開源,谷歌以外得益於谷歌大腦的項目更是數不勝數。到了2016年,“AI先行”在谷歌已經不只是一句口號,而是隨處可見的事實了。

2015年,谷歌創始人拉裡·佩奇和謝爾蓋·布林宣佈成立母公司Alphabet,而谷歌則變成了Alphabet旗下諸多子公司之一。

圖55 谷歌母公司Alphabet旗下的主要子公司一覽

為什麼拉裡·佩奇和謝爾蓋·布林要重組公司結構,將谷歌置於母公司Alphabet的旗幟之下?有人說,這是在分離健康盈利的資產和暫時虧損的早期項目;有人說,這是在給每個獨立業務的未來發展提供更廣的成長空間;有人說,這是在用兄弟公司打造生態系統,實現相互加持……

我認為,上述說法都有道理。但拉裡·佩奇和謝爾蓋·布林之所以要重組公司,還有一個重要原因就是要以谷歌大腦為基礎,建立一個面向人工智能時代的新技術平台。在這個平台上,基於深度學習的谷歌大腦是驅動引擎,幾乎每一家Alphabet旗下的子公司都像是安裝了這一引擎,在不同賽道上飛馳的賽車。這裡面既有人工智能驅動的生物醫療項目Calico,也有智能家居項目Nest,既有曾風光無限的自動駕駛項目Waymo,也有面向智慧城市的Sidewalk Labs。當然,Alphabet旗下最能帶來現金收益的龍頭老大,還要數早已將人工智能作為核心競爭力的搜索與移動互聯網巨頭——谷歌。

所有這些圍繞人工智能技術建立的戰略方向,讓整個Alphabet集團變成了世界上最大的AI平台!

谷歌的“AI先行”戰略為谷歌帶來了展望未來的最好資本。其他互聯網巨頭或高科技公司也不甘示弱,紛紛展開面向AI時代的戰略佈局。

老牌IT公司IBM未來10年的戰略核心是“智慧地球”計劃,希望在智慧能源、智慧交通、智慧醫療、智慧零售、智慧能源和智慧水資源等領域全面發力。IBM Watson作為知識解決服務的代表,營收已佔IBM總營收的22.17%143。今天的IBM Watson已經不再是一個單一的智能系統,而是被分解成不同領域裡的人工智能組件,隸屬於40多種不同的產品,分別解決不同行業、不同場景下的AI問題。

圖56 2016年3月至2017年2月,英偉達(NVIDIA)公司股價的走勢144

在顯卡芯片領域深耕多年的英偉達(NVIDIA)公司在人工智能時代迎來了最好的機會。因為深度學習天生青睞於顯卡中圖形處理器(GPU)的強大計算能力,英偉達公司在AI時代一躍成為比英特爾CPU還要搶眼的核心驅動力。雖然深度學習的底層計算、加速芯片還遠未達到一種技術包打天下的地步,GPU架構之外尚有ASIC、FPGA等多種不同的基礎架構,但在深度學習的芯片市場上,英偉達已佔據先機。與此同時,英偉達又多點佈局,全面開展對深度學習加速軟件、高性能深度學習計算服務器、自動駕駛解決方案等產品的研發。過去一年裡,英偉達的股價一路飆升,這基本反映了英偉達在人工智能技術體系內的重要程度。

社交網絡巨頭Facebook不但將深度學習“三巨頭”之一的揚·勒丘恩招至麾下,還挖到了著名深度學習框架Caffe的作者,曾在谷歌大腦工作的賈揚清。2016年11月,Facebook宣佈,賈揚清的技術團隊基於Caffe開發了一個基於移動設備的深度學習框架Caffe2go,首次在運算能力受限的手機上實現了實時的圖像與視頻捕獲,以及後續基於深度學習的分析、處理。賈揚清說:“隨著我們的不斷進步,你可以想像,可以在(移動)設備上運行的實時AI技術將能幫助這個世界變得更加開放,讓人與人之間的聯繫得以加強,特別是在無障礙應用和教育等領域。可以拿在手上的智能設備將會持續地改變我們對智能的定義。”145

谷歌、Facebook等互聯網巨頭不但在戰略上紛紛佈局人工智能,在技術層面加大人工智能的研發力度,還在最近五六年的時間裡,大幅提高了對人工智能初創公司的收購力度。例如,谷歌收購Deep Mind公司並推出震驚世界的Alpha Go的故事早已成為人工智能領域最值得稱道的投資案例。事實上,據不完全統計,從2011年開始,谷歌、IBM、雅虎、英特爾、蘋果等科技巨頭總計收購了140家初創的AI公司,其中,僅2016年一年,科技巨頭對AI初創公司的收購案例就多於40件。

圖57 按季度統計的AI初創公司被收購和併購的數量146

迄今為止,人工智能方向金額最為龐大的一筆收購發生在自動駕駛領域。2017年3月初,據報道,英特爾公司以153億美元的巨資收購曾經為特斯拉Autopilot輔助駕駛方案提供技術的以色列公司Mobileye。這一收購創下以色列科技公司被收購的最高價,也深刻影響了整個人工智能的創投格局。例如,所有研發自動駕駛技術的創業公司在下一輪融資時,也許都會用這個收購案作為對標依據。

人工智能已經成為高科技企業制定戰略規劃時無法忽視的一部分。無論是依靠自身力量建立人工智能團隊,還是通過收購、併購的方式獲得相應的研發能力,高科技企業越早重視人工智能,越早擁有人工智能技術力量,就越容易掌控未來競爭。

科技“巨頭”的潛在威脅

科技巨頭全面擁抱人工智能,這當然是驅動技術革命的重要力量。但另一方面,科技巨頭在人工智能領域的巨大投入也隱隱讓專業人士為之擔憂:AI時代,數據為王。谷歌等行業巨頭坐享地球上最為豐富的大數據資源,利用這些龐大數據資源幫助人類克服挑戰、解決問題當然最為理想,但誰又能從法律、道德等層面保證,對這些大數據資源的壟斷不會成為行業巨頭謀求一己私利的壁壘與工具?

硅谷著名投資人、網景公司(Netscape)聯合創始人馬克·安德森(Marc Andreessen)說,大企業在AI領域擁有幾個巨大的優勢147:

·懂得如何創建AI系統的人數非常有限。大企業可以為他們支付比創業公司更多的薪酬,就像僱用體育明星。大企業差不多可以把他們都收入麾下,留給其他企業的人才將少之又少。

·AI項目通常都非常大、非常複雜。這是全新的科技領域。亞馬遜的Echo智能音箱是大約1500名工程師開發4年才完成的(註:馬克·安德森這裡說的工程師人數應該是有些誇大了,亞馬遜CEO傑夫·貝索斯2016年5月在另一個場合的說法是:經過4年發展,Echo團隊目前已有超過1000名員工148)。創業公司可沒法投入如此多的資源。

·此外,還有對數據的需求。你需要巨大數量的數據集來創建AI應用。谷歌和Facebook之類的大型企業可以訪問浩如煙海的數據資源,而創業公司則只能望洋興歎。

2016年9月,谷歌(包括Deep Mind)、亞馬遜、Facebook、IBM和微軟等甚至結成了AI聯盟(Partnership of Artificial Intelligence),並宣稱:“我們相信人工智能技術必將改進人們的生活質量,並可幫助人類解決氣候變化、糧食、不平等、健康和教育等全球性問題。為了更好地造福人類和社會,AI聯盟致力於引導研究,組織討論,分享觀點,提供思想領導力,徵詢第三方建議,回答公眾和媒體的疑問,並創建教學資源以推動包括機器感知、學習、自動推理等領域的AI技術普及。”149

巨頭圍繞AI技術結成夥伴關係,共同推動AI發展和合理應用,從這樣的角度來看,這當然是件好事。但從另一個角度來說,巨頭聯盟只會加劇資源的進一步集中甚至是封閉。

我在參加瑞士達沃斯經濟論壇時,曾和維基百科創始人吉米·威爾士等人討論平台的力量。我們覺得,在國際化、資本、互聯網趨勢等共同作用下,未來的AI將會形成非常強大的平台,美國如谷歌、Facebook,中國如微信、淘寶。這些平台將彙集、整合原本零散的內容或應用,並因此大幅改善用戶體驗,使更多用戶更容易享受到AI的巨大價值。

但專業人士和普通公眾也有理由對這些集中了大量數據和計算資源的AI平台提出合理的質疑。例如,這些平台特別是巨頭聯盟的力量將特別強大,它們對整個科技圈的輿論影響將是決定性的。體量較小的平台發出的不同聲音,很難在巨頭世界裡傳達給普通公眾。

同時,巨頭圍繞AI建立的平台也缺乏足夠的透明性,較難與外界保持有效的溝通。一旦這些AI平台的利益與公眾利益不符,在商業上也找不到可以制衡這些大平台的第三方力量。舉個例子,假如Facebook借助龐大的社交網絡資源,希望通過智能算法主動引導信息流動,並進而影響美國總統大選時的選民傾向,這在技術上幾乎是完全可行的。我們當然知道,目前的谷歌、Facebook等巨頭對人類的實際貢獻遠多於它們“作惡”的可能性,但從法律、道德角度,我們又必須想辦法防範這一潛在風險。因為再友善的巨頭本質上也是商業公司,巨大的商業利益永遠是誘惑它們“作惡”的誘餌。

技術開源和數據開放方面,其實谷歌已經算是做得非常好的了。谷歌開源的Tensor Flow框架,已經成為業界深度學習的標準框架之一。谷歌在過去的幾年時間裡,連續開源You Tube 8M、Open Images、Audio Set等包含數百萬份視頻、圖片、音頻的標注數據集,為人工智能領域的科研發展提供“原材料”。但我們也必須知道,谷歌、Facebook這樣的大企業很難主動開放那些關乎它們核心業務的網頁標注、結果排序的特徵、用戶點擊次數、廣告轉換指標等,對這些數據的壟斷將AI世界裡的大數據海洋分割成了一個個相互隔離的區域。

更糟糕的是,巨頭建立的AI平台以及巨頭之間的結盟關係,有可能讓數字鴻溝變得越來越嚴重。信息在人工智能算法的組織、管理下,會更多地向有信息理解和處理能力的平台、企業、終端用戶傾斜,接受過高等教育、積極參與網絡生活的用戶更加容易獲得信息和人工智能應用的幫助,而教育水平低、較少參與網絡生活的用戶則難以找到可以改善自己生活的有效信息。想一想電子商務平台上的智能推薦算法:一個用戶越是頻繁購物,就越容易得到最適合自己的商品信息。類似的場景會在許多有真實信息需求的領域存在,信息或大數據世界裡的富者愈富、窮者愈窮現象並不是危言聳聽。

對於這樣的“巨頭風險”,我覺得我們應該從法律和制度建設層面,多做些有前瞻性的事情,包括:

·提高大數據和人工智能應用領域的透明度,鼓勵公開那些不涉及用戶隱私和商業機密的研發成果,鼓勵開源。

·更多地鼓勵利用區塊鏈技術管理數據和信息流動,從技術和制度雙方面打破科技巨頭對大數據的壟斷。

·成立有社會責任感的VC基金,專注於新興的大數據和人工智能方向。

·多關注能夠幫助落後人群獲取信息、享受AI福利的平台。

·鼓勵大眾和媒體去監督行業巨頭的商業行為。

在瑞士達沃斯,我受邀與麻省理工學院媒體實驗室負責人伊籐穰一探討巨頭可能對AI的壟斷。我的看法是,目前的體系會持續促使大型科技企業不斷發展。它們有能力壟斷資源、壟斷數據,在商業利益和激烈競爭的驅使下,它們會不斷地競逐更為精進的技術能力,為公司賺取更大的利益。對於較小企業,進入AI市場的難度的確比移動互聯網時代的創業高出非常多。我呼籲大力推動AI生態系的開放性。在創新工場北京總部和我們所投的創業公司體系中,已經啟動了全新的AI技術相關研發工作。近期,創新工場也成立了人工智能工程院,帶著孵化中國AI生態系的目標投入大量資源,招聘培訓一批年輕工程師入門AI領域,展開可公開數據集的採集和標注。我們也積極尋求在中國和全球資本市場的融資和成長機會。

我覺得,目前有些公司採取所謂公開透明的做法,其實是很討喜的宣傳手段。但我也確實擔心,下面這種兩難問題會不會出現:一些公司選擇通過自律或推動立法來限制錯誤的發生,但另一些公司不會這麼做。自然而然,比較規範自律的公司由於發展顧慮更多、更全面,相對發展速度上可能放緩;而較不顧慮錯誤發生的企業,反而可能成為最快速或最成功的那一方。這很難說是一個好的還是不好的發展態勢。

例如在自動駕駛技術的開發上,谷歌很小心謹慎,把保護駕乘人員和行人放在了極其重要的位置上,技術不成熟就不推廣;相反,特斯拉的Autopilot就很激進,會直接把測試版產品拿給公眾進行試驗。然而現在看來,特斯拉造出好的自動駕駛汽車的可能性也許要更大一點兒。所以,這個難題對任何規模、任何階段的企業,都是一個道德層面的決策。

伊籐穰一則認為,隨著世界愈發緊密互聯,要以“贏家通吃”的玩法去壟斷市場越來越難。現在,如果某個個體試圖進行壟斷行為,會自動觸發市場機制。市場競爭會形成限制:如果某方採取壟斷動作,對標競爭的另一方會花數百上千萬美元去找到超級優秀的AI博士們來迎頭趕上。現今人才培養的源頭已經到位,但我擔心,當某個企業實現了壟斷甚或做上了寡頭的時候,自然而然能順勢招募AI領域的全球才俊,吸引能夠負擔他們百萬美元酬金的投資人,種種多方因素都正匯聚在一起。市場單方面依賴競爭機制進行調節並不完善。

伊籐穰一說:“因此,我對開復和創新工場在中國推動的開放做法特別感興趣。而且,資本主義的市場競爭是不會激勵大家分享數據、資源和市場的。傳統的政府監管方式過去曾經行之有效,但在面對互聯網的開放和動態結構時,這種傳統的監管方式將會失效。現在這些AI、比特幣和其他所有領域中的問題,都不是過去10年、20年間學者們研究的題目,而是真正在資本市場能夠快速賺錢的技術。然而相較於開放的互聯網,行業不曾充分在開放領域來探討這些技術衍生的問題和現象,這是我的擔憂所在。”150

總的來說,巨頭壟斷大數據資源、壟斷科研與輿論的風險客觀存在。而在國家政策層面、法律法規層面甚至道德層面,我們還缺乏應對這種潛在風險的有效體系。

我感覺,儘管存在潛在威脅,但這就像人類站在一道剛剛開啟的大門面前,門外是一個美麗而神秘的新世界,既流光溢彩又暗藏危機。勇敢者必會腳踏實地,正視問題,大膽實踐。因為大門外面,是人類真正的未來。

AI創業是時代的最強音

偉大的創業需要生逢其時

創業大潮裡,有的創業者脫穎而出,有的創業者負重前行。我們雖不以成敗論英雄,但如果一定要找一條誕生偉大公司的必要條件,我會選擇“生逢其時”。

雷軍創立小米的傳奇讓“風口論”深入人心——只要站在風口,豬也能飛起來。有人說,這是絕對的機會主義。但在創業的時代大潮中,是否符合科技大趨勢的確是決定創業成敗的第一要素。

同樣生於1955年的比爾·蓋茨和史蒂夫·喬布斯在競爭桌面電腦時代的王者地位時,兩個人都才20歲出頭,他們都年輕氣盛,也都有著傲人的天資。但設想一下,如果蓋茨和喬布斯在20世紀70年代就開始投入互聯網創業(我這個假設並不是異想天開,因為20世紀70年代,早期互聯網已經開始連接幾所美國大學並開展實驗運行),那他們恐怕連足夠支持創業的投資都拉不到。

生於1964年的傑夫·貝索斯在1994年創立亞馬遜,生於1968年的楊致遠同樣在1994年創立雅虎。1994年,那時互聯網剛剛開始在歐美普及,歐美之外很多地方的電腦用戶還不知互聯網為何物。貝索斯和楊致遠在30歲上下的年紀,抓住了互聯網萌芽、興起的最好時期,用他們的創業天分,為互聯網時代打下了帶有個人特色的烙印。

生於1983年的凱文·斯特羅姆(Kevin Systrom)和生於1990年的伊萬·斯皮格(Evan Spiegel)是移動互聯網時代創業明星的代表。無論是凱文·斯特羅姆在2010年創立的圖像社區Instragram,還是伊萬·斯皮格在2011年創立的社交工具Snapchat,他們這種類型的創業必須依附於移動互聯網的“風口”。如果這兩個年輕人在移動互聯網時代硬是要去創立一個新的PC機品牌,與戴爾、聯想、惠普競爭,那無論他們倆的個人天賦怎樣,創業都必將以失敗而告終。

同樣地,在中國,李彥宏創立百度、張朝陽創立搜狐,他們都抓住了20世紀90年代互聯網普及的“紅利期”,而馬化騰、馬雲則分別在正確的時機站到了社交工具與電子商務的潮頭。移動互聯網時代,中國科技產業尤其異彩紛呈。前兩年一場O2O浪潮,就如大浪淘沙一般,數以千計的初創公司曇花一現,但美團、滴滴等明星公司也脫穎而出。

雷軍2010年創辦小米時,移動互聯網的大格局才剛剛顯現。第一批移動互聯網用戶大都在使用相對昂貴的i Phone手機和Android手機,中國大量普通用戶的痛點是難以接受高性能手機的高昂價格。小米在最恰當的時間,為移動互聯網的普及注入了一針強心劑——性價比超高的智能手機。無論手機市場今後如何發展,我們都無法抹殺小米在中國手機發展史上的關鍵地位。小米之後,“小米模式”成為業界競相研究的對象,智能手機的性價比如何,也成為大量用戶選購手機時的重要考慮因素。如果沒有小米在最好的時機做了這樣一件“生逢其時”的事情,中國移動互聯網的普及肯定會來得遲一些。2010年時的雷軍本人,就是“風口論”的最佳實踐者。

那麼,今天呢?

剛好20歲、30歲,有志創業的年輕人,該如何尋找今天的創業“風口”呢?我想,看過這本書的讀者,心中應該已經有了一個最好的答案——人工智能!

人工智能時代剛剛到來,人工智能領域的各種創業機會還處在相對早期的發展階段。未來四五年對於人工智能時代的意義,和20世紀70年代、80年代對於PC時代的意義相比,絕對毫不遜色。幾乎可以預言,如果人工智能時代也會出現蘋果、微軟、谷歌、百度、阿里、騰訊等偉大公司的話,那麼,這些偉大公司一定會有相當數量是在這四五年裡創立的。

在這樣一個大時代、大格局來臨的前夕,世界各國都加強了人工智能發展的佈局,支持和鼓勵人工智能方向的創業。不用說,在美國,世界最成熟的風投資本幾乎步調一致地將目前的投資重點由移動互聯網轉向了人工智能。因為資本、人才和市場三位一體的優勢,美國的人工智能初創企業不僅數量最多,而且質量最高、類型最為齊全。從舊金山到硅谷,從西雅圖到紐約,在AI芯片、AI平台、自動駕駛、智慧金融、智能醫療、機器人、智能物聯網、智能教育、智能客服等領域裡創業的公司數不勝數。有興趣的讀者,可以從CB Insights發佈的前100家人工智能初創企業名錄151中,尋找一下美國當下人工智能創業的趨勢和脈絡。

英國是另一個人工智能創業的樂園,研發Alpha Go的Deep Mind就是一大批英國AI創業明星中的代表。2017年1月,我和倫敦市長薩迪克·汗(Sadiq Aman Khan)討論英國人工智能創業氛圍時瞭解到,英國之所以在人工智能創業領域獨具特色,主要是因為英國有足夠優秀的人工智能科學家,在科研領域處於世界頂尖水平,但在資本、市場等大環境上,英國仍無法與美國相比,這是包括Deep Mind在內的許多英國創業團隊都被美國公司收購的原因。薩迪克·汗覺得,英國應當加強自己的資本生態系統(英國支持科技創新的資本總量比美國、中國還是差了不少),同時需要讓本土技術能更快地走向美國、中國等更大的市場。152

加拿大是人工智能創業的“科研型孵化器”。深度學習三巨頭中,傑弗裡·辛頓和約書亞·本吉奧都在加拿大的大學教書,這直接促成了加拿大極為出色的人工智能研究氛圍。大批人工智能方向的優秀學生從加拿大的大學畢業。他們中的相當一部分都“南下”美國工作或創業,但也有不少人選擇在加拿大開始他們的創業歷程。2016年10月,約書亞·本吉奧啟動了一個名叫Element AI的創業孵化項目,專注於深度學習技術研發,幫助蒙特利爾大學和麥吉爾大學的人工智能研究項目建立初創公司。約書亞·本吉奧說:“我將努力在蒙特利爾大學建立一個‘人工智能’生態。”153

中國的人工智能創業幾乎與世界同步。根據《烏鎮指數:全球人工智能發展報告2016》154的統計:人工智能領域,美國與歐洲投資較為密集,數量較多,其次為中國、印度、以色列。美國共獲得3450多筆投資,位列全球第一;英國獲得274筆投資,位列第二;中國則以146筆投資位列第三。美國人工智能企業總數為2905家,全球第一。僅加州的舊金山/灣區、大洛杉磯地區兩地的企業數量即達到1155家,佔全球的19.13%。中國人工智能企業數量雖不及美國,但在北京、上海、深圳三大城市,也集中了一批高質量的人工智能團隊。北京、上海、深圳的AI企業數量佔全球總數的7.4%,在東亞地區位列前三。其中,北京的AI企業就有242家。

AI時代,最大“風口”就是人工智能本身。肯定不是所有豬都能在風口飛起來,但要做一飛沖天的創業英雄,就一定要看準科技大勢,選擇最正確的時機做最正確的事。

人工智能的商業化路線圖

本質上,過去20年的互聯網和移動互聯網是一個不斷將線上、線下的業務場景緊密連接,同時也不斷促使數據產生、流轉、集中和再利用的過程。如果把世界看成一個大市場,互聯網和移動互聯網的作用就是讓這個大市場中的信息更透明,讓信息流通更順暢,以此降低交易成本,消除信息不對稱。

但在知識、數據的積累達到一個頂峰,業務流程也因為信息的高效流轉而順暢連接到一起後,如何進一步提高生產率,降低業務成本,提升業務收入呢?我們認為,下一次生產率革命的關鍵是“自動化”,而人工智能正是幫助現有流程實現自動化的最好工具。

從投資人的角度看,AI興起的最大契機還不是深度學習技術的發明,而是過去20年互聯網、移動互聯網的高速發展對自動化的強烈需求。有了這個需求,有了成熟的業務流程和高質量的大數據,深度學習技術的突破就是“萬事俱備,只欠東風”的事了。

所以,戰略方面,我們絲毫不用擔心AI能否落地、能否商業化。谷歌、Facebook、百度等互聯網巨頭的搜索和廣告業務本質上就是機器學習驅動的,而且早已被證明是成功的。我們需要關心的只是人工智能在接下來的時間內,以何種趨勢、何種方式在其他領域落地的問題。

創新工場管理合夥人、資深投資人汪華認為,人工智能的商業化大致可分為三個主要階段:

第一階段,AI會率先在那些在線化程度高的行業開始應用,在數據端、媒體端實現自動化。這一過程會首先從線上“虛擬世界”開始,隨著在線化的發展擴張到各個行業,幫助線上業務實現流程自動化、數據自動化、業務自動化。

互聯網和移動互聯網的發展已經在許多領域為AI做好了業務流程和數據上的準備。擁有高質量線上大數據的行業會最早進入人工智能時代。例如,大家常說金融行業是目前人工智能應用的熱點,這正是因為金融行業特別是互聯網金融已經做好了使用AI的準備。此外,美團等公司將餐飲服務與線上業務連接了起來,滴滴、摩拜單車等公司將交通出行與線上業務連接了起來,在這些擁有線上業務流程和高質量數據積累的地方,AI同樣開始發揮作用,大幅提高線上業務的自動化程度。

第二階段,隨著感知技術、傳感器和機器人技術的發展,AI會延伸到實體世界,並率先在專業領域、行業應用、生產力端實現線下業務的自動化。

可以感知實體世界信息的傳感器和相關的感知技術會越來越成熟,越來越便宜。在線下業務中,計算機系統可以通過物理方式接收線下信息或幫助完成線下操作。這個轉變意味著人工智能從線上的“虛擬世界”走進了線下的實體世界。這個階段,人工智能的商業化會首先從生產力的角度切入,整個世界的生產製造會逐漸被AI滲透。工業機器人、倉儲機器人、物流機器人等將在這個階段實現大範圍的普及。

第三階段,當成本技術進一步成熟時,AI會延伸到個人場景,全面自動化的時代終將到來。

隨著技術的日趨成熟,相關的智能產品價格大幅下降,AI終將從企業應用進入個人和家庭。那時,每個人的工作和生活中,大量的應用場景都會因為AI的幫助而更加自動化、更有效率,人類的生活質量終將因AI的普及而大幅提升。這個階段裡,AI商業化的核心目標是創建全面自動化的人類生活方式。

根據汪華的判斷,我們目前正在進入AI商業化的第一個階段,也許只需要3年左右的時間,AI就可以在各種在線業務中得到普及。AI商業化的第二個階段,要花五六年、六七年的時間才能充分發展起來。而標誌著全面自動化的第三階段,也許需要十幾年或更長的時間。

就像過去20年互聯網和移動互聯網的商業化所走過的歷程一樣,人工智能的商業化會以自己的節奏,分階段、分步驟地滲透到人類生產、生活的方方面面。而且,AI對整個社會的改變,可能比過去20年互聯網革命所帶來的改變要大得多。能否準確把握AI商業化的脈絡,是AI時代的創業能否站在“風口”上的關鍵。

AI創業的五大基石

每個時代的創業有每個時代的特點。人工智能創業就與此前的互聯網時代創業、移動互聯網時代創業很不相同。

圖58 人工智能創業的五大基石

按照我的歸納和總結,人工智能時代的創業有五個前提條件:

·清晰的領域界限:人工智能創業,要解決的領域問題一定要非常清晰,有明確的領域邊界,因為這一類問題是今天以深度學習為代表的人工智能算法最善於解決的。例如,同樣是做機器人,如果做一個借助視覺傳感器更好地規劃掃地線路、提高清潔效率的掃地機器人,將機器人的需求限定在一個有限的問題邊界內,這樣的解決方案就相對靠譜;如果上來就要做一個長得像人一樣、可以與人交流的人形機器人,那以今天的技術,做出來的多半不是人工智能,而是“人工智障”。

·閉環的、自動標注的數據:針對要用AI解決的領域問題,最好要在這個領域內,有閉環的、自動標注的數據。例如,基於互聯網平台的廣告系統可以自動根據用戶點擊以及後續操作,收集到第一手轉化率數據,而這個轉化率數據反過來又可以作為關鍵特徵,幫助AI系統進一步學習。這種從應用本身收集數據,再用數據訓練模型,用模型提高應用性能的閉環模式更加高效。谷歌、百度等搜索引擎之所以擁有強大的人工智能潛力,就是因為它們的業務,比如搜索和廣告本身就是一個閉環的系統,系統內部就可以自動完成數據收集、標注、訓練、反饋的全過 程。

·千萬級的數據量:今天人工智能的代表算法是深度學習。而深度學習通常要求足夠數量的訓練數據。一般而言,擁有千萬級的數據量是保證深度學習質量的前提。當然,這個“千萬級”的定義過於寬泛。事實上,在不同的應用領域,深度學習對數據量的要求也不盡相同。而且,也不能僅看數據記錄的個數,還要看每個數據記錄的特徵維數,特徵在相應空間中的分佈情況,等等。

·超大規模的計算能力:深度學習在進行模型訓練時,對電腦的計算能力有著近乎“癡狂”的渴求。創新工場曾經給一個專注於研發深度學習技術的團隊投資了1000萬元人民幣。結果,團隊建設初期才兩三個月時間,僅購買深度學習使用的計算服務器就花掉了700多萬元。今天,一個典型的深度學習任務,通常都要求在一台或多台安裝有4塊甚至8塊高性能GPU芯片的計算機上運行。涉及圖像、視頻的深度學習任務,則更是需要數百塊、數千塊GPU芯片組成的大型計算集群。在安裝了大型計算集群的機房內,大量GPU在模型訓練期間發出遠比普通服務器多數十倍的熱量。許多機房的空調系統都不得不重新設計、安裝。在一些空調馬力不足的機房裡,創業團隊甚至購買了巨大的冰塊來協助降溫。

·頂尖的AI科學家:今天的人工智能研發還相當依賴於算法工程師甚至是AI科學家的個人經驗積累。水平最高的科學家與普通水平的算法工程師之間,生產力的差異不啻千百倍。人工智能創業公司對頂尖AI科學家的渴求直接造成了這個領域科學家、研究員的身價與日俱增。谷歌僱用傑弗裡·辛頓、李飛飛,Facebook僱用揚·勒丘恩,據說都開出了數百萬美元的年薪。國內AI創業公司如曠視科技,也用令人瞠目的高薪,將機器視覺領域的頂尖科學家孫劍“挖”了過來,擔任公司的首席科學家。

AI創業的泡沫現象及六大挑戰

當然,看到人工智能創業機遇的同時,我們也必須保持足夠清醒的頭腦。2016年到2017年,人工智能的創業和投資明顯存在無序、失衡、過熱的情況。人們常常擔憂的泡沫現象的確存在。

看一看如星火燎原一般在美國、中國、以色列等地建立的自動駕駛創業團隊吧,自動駕駛這個行業確實巨大,但真的需要那麼多早期創業團隊嗎?要做一個第4級或第5級的自動駕駛,技術難度異常大,非要投入巨資和最頂尖的研發人才不可。那麼,這麼多初創的自動駕駛團隊裡,究竟有幾個是可以在自動駕駛普及的那一天倖存下來並成長為行業巨人的呢?

家用機器人的概念就更別提了。那麼多號稱開始研發家用機器人的公司,如果是做亞馬遜Echo那樣限定使用場景的智能家電還好說,如果上來就要做語言交流、人形外觀的機器人,那幾乎一定會因為技術水平無法達到人類用戶的預期而走向失敗。這道理很好理解,越是長得像人的機器人,用戶就越是會用人的標準去衡量、評價它,希望越大,失望也就越大。

語音和自然語言處理方面的創業也有類似問題。今天的語音識別雖然做得相當不錯,但機器的能力僅限於感知領域,只能完成聽寫這種以轉錄為主的任務。也就是說,機器目前只能很有效地將語音轉換為文字,但根本無法直接理解文字的含義。只有限定一個非常特定的領域,技術才能解決問題,如果要求自然語言處理算法支持通用的人機對話,那就不切實際了。目前有許多從事智能客服、智能聊天機器人創業的團隊,這些團隊如果不善於界定問題領域,就很容易將需求問題變複雜,以至於人工智能技術也愛莫能助。

基於人臉識別技術的身份認證、安防類應用是中國人工智能創業的特色領域,並已經產生了至少四家獨角獸或接近獨角獸規模的創業公司。但這個領域的市場空間絕對不會像自動駕駛那麼寬廣,目前二三十家公司都要削尖腦袋擠進人臉識別市場的情況顯然是過熱了。

基於人工智能的輔助醫療診斷剛剛起步,就出現了一大批瞄準這一方向的創業公司。但只要是熟悉醫療行業的人都很清楚,在這個行業裡,要得到閉環的、有標注的、數據量足以發揮深度學習效能的醫療大數據,其難度遠超普通人的想像。沒有符合要求的醫療數據,人工智能又該從何談起?所以,在智能醫療領域,今後可以成功的初創公司,一定是那些既懂人工智能算法,又特別瞭解醫療行業,可以收集到高質量醫療數據的公司。

概括來說,目前的人工智能產業發展面臨六大挑戰:

一、前沿科研與產業實踐尚未緊密銜接:除少數垂直領域憑借多年大數據積累和業務流程優化經驗,已催生出營銷、風控、智能投顧、安防等人工智能技術可直接落地的應用場景外,大多數傳統行業的業務需求與人工智能的前沿科技成果之間尚存在不小距離。面向普通消費者的移動互聯網應用與人工智能技術之間的結合尚處在探索階段。科學家和研究者所習慣的學術語境,與創業者和工程師所習慣的產品語境之間還無法快速銜接。

二、人才缺口巨大,人才結構失衡:據Linked In統計,全球目前擁有約25萬名人工智能專業人才,其中美國約占三分之一。這一數量級的人才儲備遠無法滿足未來幾年中人工智能在垂直領域及消費者市場快速、穩健增長的宏觀需求。人才供需矛盾顯著,高級算法工程師、研究員和科學家的身價持續走高。人才結構方面,高端人才、中堅力量和基礎人才間的數量比例遠未達到最優。

三、數據孤島化和碎片化問題明顯:數據隱私、數據安全對人工智能技術建立跨行業、跨領域的大數據模型提出了政策、法規與監管方面的要求。各垂直領域的從業者從商業利益出發,也為數據的共享和流轉限定了基本的規則和邊界。此外,許多傳統行業的數據積累在規範程度和流轉效率上還遠未達到可充分發揮人工智能技術潛能的程度。

四、可復用和標準化的技術框架、平台、工具、服務尚未成熟:雖然Tensor Flow、Caffe、MXNet等深度學習框架已被數以萬計的研發團隊採納,相關開源項目的數量也在飛速增加,但一個完整人工智能生態所必備的,從芯片、總線、平台、架構到框架、應用模型、測評工具、可視化工具、雲服務的模塊化與標準化工作,尚需3年或更長時間才能真正成熟。

五、一些領域存在超前發展、盲目投資等問題:目前的人工智能技術只有在限定問題邊界、規範使用場景、擁有大數據支持的領域才能發揮最大效能。但創投界存在盲目追捧,不顧領域自身發展程度,或利用人工智能來包裝概念等現象。由此產生的盲目創業和投資問題雖非主流,但仍有可能阻礙整個行業的健康發展。

六、創業難度相對較高,早期創業團隊需要更多支持:與互聯網時代、移動互聯網時代的創業相比,人工智能創業團隊面臨諸多新的挑戰。例如,對高級人才較為依賴,科學家創業者自身的商業實踐經驗較少,高質量大數據較難獲得,深度學習計算單元和計算集群的價格十分昂貴,等等。

AI是中國創新、創業的最好機會

如前所述,AI創業既客觀存在局部過熱的泡沫,也有巨大的潛能尚待挖掘。總體來說,目前的人工智能大格局中,機遇是主旋律,泡沫和危機是必須克服的局部挑戰。這一格局在全球如此,在中國亦如此。

而且,若專就中國AI創業環境來說,人工智能更是助力中國科技騰飛的最好機會之一。互聯網和移動互聯網時代,中國科技精英已經用淘寶、微信、摩拜單車等“中國創新”讓世界看到了我們的創造力和執行力。人工智能時代,中國的人才優勢、市場優勢、資金優勢、堅持多年創新的商業模式優勢等,都是人工智能最好的生長土壤。如果措施得當,行動高效,中國甚至有可能借人工智能技術全面佔據信息科技的制高點,在創新、創業領域真正成為引領者而不是跟隨者。

AI領域,中國人/華人已是科研中堅

2016年,美國白宮發佈的《國家人工智能研究與發展策略規劃》報告從Web of Science核心數據庫裡查詢提到“深度學習”或“深度神經網絡”的文章,統計其數量變化趨勢。報告說,從2013年到2015年,SCI收錄的論文裡,提到“深度學習”的文章增長了約6倍,同時強調:“按文章數計算,美國已不再是世界第一了。”

美國不是世界第一?誰是世界第一呢?報告指出,中國發表的相關論文數量在2013年及以前還落後於美國,而在2014年和2015年,中國的相關論文數量就躍居世界第一。如果只統計論文數量,中國在AI研究領域,已經是不折不扣的領跑者了。

白宮《國家人工智能研究與發展策略規劃》中的數字統計,其實還是存在一些技術上的問題,比如,直接搜索關鍵字“深度學習”“深度神經網絡”,是否真的能涵蓋這些年人工智能領域的所有科學研究進展?統計論文數量時,是否要考慮論文所發表期刊的影響因子,以便衡量論文的重要程度?

創新工場使用更嚴格的條件,只統計Web of Science核心數據庫中SCI影響因子較高的人工智能期刊中的論文,並在主題上涵蓋人工智能相關的所有科研領域,做了一次獨立的數據分析。

根據創新工場的統計,在2006年到2016年的時間段裡,近兩萬篇頂級的人工智能文章中,由華人貢獻的文章數和被引用數,分別佔全部數字的29.2%和31.8%。近10年,華人用五分之一左右的作者人數,平均貢獻了三成的頂級AI研究文章和被引用數。從統計角度來看,這已經是超出平均水平的科研貢獻了。

圖59 華人在人工智能研究領域的貢獻占比

從變化趨勢看,2006年到2015年,華人作者參與的頂級AI論文,佔全部頂級AI論文數量的比例,從23.2%逐年遞增到42.8%。而華人作者參與的頂級AI論文被引用次數,佔全部頂級AI論文被引用次數的比例從25.5%逐年遞增到55.8%。

圖60 華人在人工智能研究領域貢獻的變化趨勢

舉例來說,《IEEE模式分析與機器智能彙刊》(IEEE Transactions on Pattern Analysis and Machine Intelligence,簡稱PAMI)在2006年到2016年,引用數很多的前500篇頂級的人工智能論文中,作者一共1220人,其中華人科學家、研究者316人,占25.9%。所有作者單獨累加計算的被引用數總和是231361次,其中,華人科學家、研究者被引用數總和是63846次,占27.6%。如果單看2014年(當年華人的文章數、引用數均較高)的數據,華人科學家、研究者被引用數占51.8%,超過了半數。

也就是說,即便只統計頂級出版物裡的頂級文章,中國人/華人在人工智能領域的貢獻,在發展趨勢上也和白宮報告中揭示的規律一致——無論從哪個角度來說,中國人/華人正在人工智能領域裡發揮舉足輕重的作用,而且,從2014年和2015年開始,中國人/華人已經處於人工智能研究的領先地位,佔據了人工智能科研世界的半壁江山!

當然,需要特別指出的是,我們不能單看這些反映整體趨勢的統計數據就沾沾自喜。事實上,上述數據所表現的,僅僅是中國AI科學家以及全世界的華人AI科學家作為一個整體,已成為AI科研的最大陣營這一事實。但從突破性科研貢獻的數量和質量上說,中國還無法與美國相比。如果只統計那種革命式的、里程碑式的突破,中國人或華人的占比就會少很多了。深度學習“三巨頭”中沒有一個華人面孔,這個事實至少說明,中國或世界華人科研群體中,還缺少頂級大師式的人物。用圍棋的段位來比喻的話,就是中國在人工智能領域擁有不少六段、七段甚至八段的高段位棋手,但暫時還缺少九段的頂級高手。

一方面,客觀承認中國與美國在AI前沿科研上仍存在較大差異;另一方面,我們也必須看到中國AI科研力量的蓬勃興起。中國國內的研究者和分佈在世界各地的華人研究者,他們在人工智能領域共同構成了一個巨大的人才儲備庫。無論是從國家的層面,還是從投資者、創業者的層面,我們都應該想辦法培育好、用好這個人才庫,盡量鼓勵海外華人科學家回國創業,或者幫助國內創業團隊盡快趕超世界水平。

中國有獨具優勢的AI創業環境

儘管存在諸多挑戰,但我仍然大膽預測,在未來5年內,中國將會誕生許多世界級水平的人工智能企業。為何我會如此堅定?因為中國具備了人才儲備、行業需求、龐大市場、生態系統等許多極有利於人工智能發展的條件。

人才儲備方面,除了上節提到的中國科研力量不可忽視之外,中國人也普遍對國內的數學等理工科的教學水平感到自豪。高水準基礎科學、工程學教育可以造就大批高素質的年輕人才,這是任何一個新興產業賴以發展的關鍵。

中國學生普遍理工科較強,數學較強。這在人工智能時代裡,顯然有巨大的優勢。龐大的理工科學生基礎,造就了一大批高素質的人工智能科學家、工程師。同時,即便是沒有專門去學計算機科學的學生,他們中有很多已經具備了非常扎實的數學知識,這些學生在需要時可以通過培訓,較快地成為掌握深度學習等人工智能技術的算法工程師。目前,創新工場正和許多致力於人工智能發展的企業一道,加強與高校的合作,努力培養更多的人工智能人才,同時也投入資金,開展人工智能科研數據集和競賽的建設,讓更多的人有機會參與到人工智能技術的普及和提高中來。

行業需求方面,中國的傳統行業較為薄弱,但這種狀況反而給中國帶來了一種後發優勢。如今,中國許多傳統企業在技術轉化領域還大幅落後於美國企業。但是這些中國企業坐擁的是海量數據和充沛資金。它們有熱情也有動力去投資那些能幫助企業拓展業務、提高收益、降低成本的人工智能技術與人才。

此外,中國有全球規模最大的互聯網市場,網民人數近八億,大量的互聯網公司正在深耕市場。很多非人工智能的互聯網公司成長到一定規模之後,為了轉型升級、擴大規模,都需要引入人工智能技術。而且,中國市場既開放又有許多獨特性。儘管美國人工智能企業領先全球,但它們要想進入中國市場必須跨越重重阻礙,因為中國市場需要的是最“接地氣”的本地化解決方案。此外,對於人工智能的探索性和試用性需求,中國往往會採取相對開放和鼓勵的路線,這也可能促進行業的超速發展。

也就是說,中國雖然在人工智能的前沿研發中不如美國,但中國有獨具優勢的AI科研和創業環境,有機會實現彎道超車,後發先至。

舉例來說,美國的金融行業已經發展得非常成熟,金融企業使用的營銷、風控等模型是數十年經驗積累的結果,讓美國金融企業轉變思路,採用基於深度學習的新一代人工智能系統,這要花費大量的時間與精力。反觀中國的金融系統,各種新型金融機構十分活躍,基於互聯網的金融產品幾乎每年都在進行模式創新。中國的新興金融機構沒有那麼多歷史包袱的束縛,反而可以更快地試用或部署深度學習算法,幫助自己改進業務流程,提高效率。

現在正是將人工智能技術轉化為產業應用,解決現實社會問題的黃金時期。抓住人工智能熱潮中的機遇期,中國應當會有一番大作為。

AI黃埔軍校——微軟亞洲研究院

說到今天的中國AI創業,就不能不提一所培養人工智能人才最多,輸出人才質量最高的人工智能黃埔軍校,這就是我於1998年回國創立的微軟亞洲研究院(1998年創立時的名稱是微軟中國研究院)。

我非常懷念1998年創立微軟亞洲研究院的時光。那段時間,就像我自己的“陽光燦爛的日子”一樣,似乎只要你有足夠的熱情,就可以將全球範圍內最具實力的華人科學家聚攏在一起,共同從事機器視覺、語音識別、智能交互、多媒體、圖形學等前沿領域的研究,共同享受科研帶來的快樂。

那個時候,雖然剛剛經歷國際象棋領域的“人機大戰”,但科研界和產業界還處於人工智能發展的低谷期,人工智能科學家還不像今天這樣被高科技企業以重金“哄搶”。太多太多急功近利的科研人員耐不住人工智能領域的寂寞,都匆匆轉向其他更容易完成產業轉化的領域。

但微軟亞洲研究院不同。我們從一開始就制定了面向未來的主導原則,確定了圍繞人工智能各技術領域組建高水準研究團隊的基本思路。敢於設想別人不敢想的未來,敢於做別人不願做的研究,這是微軟亞洲研究院之所以能在數年之後成為國際人工智能領域科研重鎮的關鍵。

圖61 一張珍貴的照片:1998年,微軟中國研究院(微軟亞洲研究院前身)的初創團隊合影

在那段“陽光燦爛的日子”裡,我親自聘請或招募到微軟亞洲研究院的科研精英們一個個都那麼年輕,那麼有活力。今天,他們中幾乎每個人的名字都在科技大潮中熠熠生輝。尤其是在人工智能領域,今天中國最好的AI創業團隊裡,首席科學家的人選中,許多都曾經在微軟亞洲研究院工作過。

1999年加入微軟亞洲研究院的張宏江是視頻檢索領域的“開山鼻祖”。張宏江在微軟亞洲研究院期間,就曾帶領和指導視覺計算組解決人臉識別的問題。今天,人臉識別在中國的金融和安防兩個垂直領域得到了廣泛應用,人臉識別方向的優秀初創團隊,幾乎都能從師承關係上回溯到張宏江當年指導過的這個研究組。例如,商湯科技創始人湯曉鷗曾在微軟亞洲研究院擔任視覺計算組主任,商湯科技的核心技術團隊也基本來自微軟亞洲研究院。2016年加盟曠視科技(Face++)擔任首席科學家的孫劍曾在視覺計算組工作了十幾年,是沈向洋的得意門生,而曠視科技的技術骨幹差不多都是孫劍和湯曉鷗的學生。

圖62 微軟亞洲研究院創立早期,我和張亞勤在清華大學與計算機系學生交流

此外,像郭百寧、芮勇、馬維英、顏水成等一大批青年科學家,當年都曾在微軟亞洲研究院從事人工智能相關的科研項目。今天,郭百寧擔任微軟亞洲研究院的常務副院長,芮勇則在2016年加入聯想擔任CTO,馬維英於2017年2月出任今日頭條副總裁,顏水成現在是360公司首席科學家、人工智能研究院院長。更年輕的人工智能大牛中,曠視科技的創始人印奇、商湯科技的楊帆、初速度(Momenta)的創始人曹旭東、依圖科技的創始人林晨曦、Linkface的創始人夏炎、深度學習框架Caffe的作者賈揚清等,都有在微軟亞洲研究院實習或工作的經歷。

當年接替我擔任微軟亞洲研究院院長的張亞勤,他的研究方向主要在多媒體領域,但也和人工智能有很多交集,例如對視頻的壓縮、分類、理解,都需要AI的幫忙。相關的三維圖形學研究,會慢慢由純粹的圖形學問題逐漸演變為使用人工智能算法理解空間結構等AI問題。此外,微軟亞洲研究院當年從事搜索、大數據等方向研究的,最後都需要融合機器學習特別是深度學習技術。應該說,當年我和張亞勤為微軟亞洲研究院規劃的幾個研究組,除了其中偏重人機交互界面技術的小組(當年由王堅領導的小組。王堅後來成為阿里雲的創始人)外,其他研究組都或多或少與人工智能相關。

圖63 微軟亞洲研究院的四位歷任院長:李開復、張亞勤、沈向洋、洪小文

當年我在微軟亞洲研究院開創的一番事業,許多年後,在人工智能領域真的結出了讓人欣慰的果實。幾十年來,人工智能技術幾起幾落,但始終有那麼一批志存高遠的科學家、研究員、大學生埋頭科研,探索未知。正是因為有微軟亞洲研究院等一批面向未來的科研機構存在,人工智能才得以在今天蓬勃發展起來。

創新工場的AI佈局

2009年,我離開谷歌,創辦了幫助青年人完成創業夢想的風險投資機構——創新工場。迄今,創新工場已在移動互聯網和各垂直領域投資了近300家創業公司,其中包括30餘家以人工智能技術為核心驅動力的公司。創新工場對人工智能目前和未來落地的主要應用場景有著透徹的理解和深厚的經驗積累。

把握時機對創業和投資至關重要。創新工場根據技術成熟度和未來發展趨勢,將人工智能各應用領域劃分為現階段已成熟、3到5年成熟、5到10年成熟、10年後成熟等不同類型,並分別設計相應的投資策略。

圖64 創新工場在人工智能領域的投資佈局

如圖中所示,創新工場將人工智能領域的應用劃分為大數據、感知、理解、機器人、自動駕駛等不同門類,每個門類中,按照人工智能技術的應用成熟度,將具體應用領域排列在時間維度上。

總體來說,人工智能在互聯網、移動互聯網領域的應用,如搜索引擎、廣告推薦等方面已經非常成熟。在商業自動化、語音識別、機器視覺、手勢識別、基礎傳感器、工業機器人等方面,人工智能可以立即應用,立即收效。

金融類人工智能的應用雖然已經起步,但尚需一段時間才能真正普及。智能教育、智能醫療、AR/VR中的人工智能、量產的傳感器、商業用機器人等,預計會在3到5年成熟可用。

可以供普通技術人員乃至非技術人員使用的人工智能平台(包括計算架構、算法框架、傳感平台、雲服務等),會在3到5年後趨於成熟並擁有足夠大的商業機會。

通用的自然語言對話工具、智能助手、普及型的家用機器人等,則至少需要10年甚至更長的時間,才有可能完成商業化。

另外,在自動駕駛領域,3到5年內,必將是第2級到第3級的輔助駕駛最先大規模商用,而且,鑒於安全考慮,這些自動駕駛應用也會是限定場景、限定道路等級的。真正意義上的“無人駕駛”,即第4級或第5級的自動駕駛,還需要5到10年才能上路運行。

除了直接投資,創新工場還宣佈成立人工智能工程院。這是一個專門面向人工智能的創業人才培養基地和創業項目孵化實驗室,其使命是為人工智能創業提供人才與技術、產品和商業經驗、市場推廣、軟硬件平台、高質量大數據源等多方位的支持。

人工智能領域的高級人才和高水準技術團隊如果已經有了清晰的商業模式和成熟的產品規劃,創新工場可直接提供投資支持;如果商業模式或產品規劃尚未清晰,創新工場人工智能工程院則可使用孵化的方式,幫助創業者實現創業夢想。

創新工場人工智能工程院的主要工作任務包括:

·對接科研成果與商業實踐,幫助海內外頂級人工智能人才創業:創新工場人工智能工程院面向海內外招聘頂級人工智能科學家和駐場創業家(EIR),利用創新工場豐富的產品化和商業化經驗,協助他們完成前沿科研成果向商業應用的轉化,同時也可根據需要,為他們匹配優秀的創業夥伴,搭建高效的創業團隊,對接有價值的商業渠道,發展成熟的商業模式。

·培育和孵化高水準的人工智能技術團隊:創新工場人工智能工程院招聘人工智能相關的算法工程師、架構工程師、應用開發工程師等高級人才,並在高校相關專業招聘實習生。來自谷歌、微軟等頂級工程與研究團隊的技術專家將作為導師,帶領並培養年輕工程師、研究員,孵化高水準的人工智能技術團隊。

·積累和建設人工智能數據集,促進大數據的有序聚合和合理利用:大數據是人工智能科研與產業化的關鍵。創新工場人工智能工程院計劃在科研數據和商業數據兩個方面投入資金與技術力量,推動數據集建設和大數據聚合,探索在高效利用大數據的同時切實保證數據安全和用戶隱私的技術、流程與規範。

·開展廣泛合作,促進人工智能產業的可持續發展:創新工場正與國內頂級高校合作建設人工智能相關課程,同時也積極與技術社區、科技媒體、教育機構等開展合作。創新工場計劃利用算法競賽、技術俱樂部、論壇和會議等方式全面推動技術交流與人才培養。創新工場還希望加強與政府相關部門、國內外高科技公司的合作,促進人工智能相關的技術、格式、接口、服務的標準化,提高人工智能在更大範圍內的普及程度,建立規範、合理、健康、可持續發展的人工智能產業生態。