讀古今文學網 > AI·未來 > 05 人工智能發展的四波浪潮 >

05 人工智能發展的四波浪潮

2017年,在中國一場重要科技研討會上,唐納德·特朗普出現在會議現場的大屏幕上。這位美國總統先以英語致歡迎辭,然後突然用他誇張的語氣流利地說起了中文:「人工智能正在改變世界,科大訊飛(iFLYTEK)真的很棒。」看到這一幕,我和在場的參會者都感到非常驚訝。

特朗普當然不會說中文,這個場景是科大訊飛將其人工智能算法,通過大量的特朗普演講樣本數據訓練後的結果,該算法模擬製作的聲音無論是聲調、語氣還是風格,幾乎都能完美地模擬出特朗普的聲音。之後再套用普通話的語音模型,讓世界聽到了一個似乎從小在北京郊區長大的美國總統的聲音。科大訊飛對奧巴馬的聲音也如法炮製,把他在英文視頻直播的記者會上的發言,轉換成完美的普通話發言。

在許多著名的人工智能國際競賽中,科大訊飛在語音識別、語音合成、影像識別、機器翻譯等競賽項目中都取得了不俗的成績。即便是在「第二語言」——英語的比賽中,該公司的參賽團隊也經常能擊敗來自谷歌、DeepMind、Facebook及IBM沃森等公司的對手。

這家了不起的中國人工智能公司的創始人劉慶峰,就是1999年我在中國科學技術大學校園裡看到的「路燈讀書族」之一。他也是我創立微軟亞洲研究院後,看中的一位博士生。劉慶峰既勤奮又有創意,是當時最被我看好的年輕研究人員之一,但他謝絕了微軟獎學金和加入微軟實習的邀請,打算自己創立一家人工智能語音公司。我告訴他,中國當時的技術與美國的語音識別巨頭紐昂斯通訊公司(Nuance Communications)之間差距比較大,而且缺少有需求的客戶。不過幸好劉慶峰沒聽我的勸告,全心全意投入人工智能語音行業,創辦了科大訊飛。近20年後,在人工智能國際競賽中獲獎無數的科大訊飛無論是技術能力還是市值,都已經遠遠超越紐昂斯,成為當今世界身價最高的人工智能語音公司。

把科大訊飛在語音識別、翻譯及合成上的尖端能力結合起來,就能創造出革命性的人工智能產品——同聲傳譯耳機,可以把我們的聲音實時轉譯為其他語言。類似這樣的產品將徹底改變國際旅遊、商務及文化,並催生大量高效、高產能、有創意的新商品。

但是這個變化不會很快到來,技術的發展還需要一點兒時間。目前,人工智能革命分為四波浪潮:互聯網智能化(Internet AI)、商業智能化(business AI)、實體世界智能化(perception AI)、自主智能化(autonomous AI)。每一波浪潮都將以不同方式利用人工智能的力量,顛覆不同產業,讓人工智能更深層次地融入我們的生活。

前兩波浪潮——互聯網智能化及商業智能化——已經出現在了我們身邊,互聯網公司能以算法取代保險精算師、股票交易經理和醫生助理。現在,感知人工智能正在把現實世界數字化,機器開始學習辨識我們的臉孔,識別我們身邊的物體與語音,理解我們的需求,搞懂我們身邊的世界。第三波浪潮將徹底改變我們和世界之間的互動體驗以及模糊數字世界和現實世界之間的分界。隨著自動駕駛汽車的上路、無人機的飛天,智能機器人接管工廠,第四波浪潮——自主人工智能將進一步改變農業、交通、連鎖餐飲等眾多領域。

人工智能發展的四波浪潮

這四波浪潮的湧現依賴於不同種類的數據,而中、美兩國在每波浪潮中有著各自不同的優勢。就目前的情況具體來說,中國在互聯網人工智能、感知人工智能中取得了領先優勢,很快也可能在自主人工智能領域趕上美國。目前,美國唯一擁有明顯領先地位的是商用人工智能方面。

競爭不僅限於兩個國家之間。首創於美國及中國的人工智能驅動服務會推廣至全球幾十億用戶,這些用戶中的大部分人都生活在發展中國家。Uber、滴滴、阿里巴巴、亞馬遜等公司在發展中國家的市場上激烈競爭,但策略大不相同。硅谷巨頭試圖用它們自己的產品或服務去征服新市場,中國的互聯網公司則是投資當地想要對抗美國巨頭的創業公司。這場競爭才剛剛開始,其過程與結果將影響21世紀全球的經濟格局。

想瞭解這場競爭如何在全球發展演進,首先得深入瞭解衝擊我們經濟的每一波人工智能浪潮。

第一波浪潮:互聯網智能化

互聯網人工智能可能已經牢牢吸引你的目光,甚至已經緊緊抓住你的錢包。你是否沉迷抖音視頻無法自拔?看到在線視頻網站向你推薦本就打算看的內容有沒有感到驚訝?淘寶和京東怎麼好像知道你想買什麼?

若你曾有類似體驗,那麼你已經是互聯網人工智能的受益者(或是受害者,取決於你如何看待你的時間、隱私與錢包)。第一波浪潮興起於近15年前,在2012年左右成為主流。大體上說,互聯網人工智能就是使用人工智能算法作為推薦引擎:這些算法瞭解、研究、學習我們的個人喜好,從而推薦專門針對我們的內容。

驅動這些人工智能引擎的,正是它們獲得的數據。目前最大的數據庫大部分都在互聯網巨頭手裡。但是這些數據必須「貼上標籤」,才能真正對算法有所幫助。這裡的「標籤」並不需要主動評價內容,或是給內容加上關鍵詞,而是把數據和特定行為連接起來,如購買與未購買,點擊與未點擊,觀看完整視頻與中途切換至其他視頻。這些「標籤」都被用來訓練算法,然後由算法推薦內容與商品給用戶,讓我們消費得更多。

一般人認為這意味著互聯網變得更好了,更瞭解我們想要的(也更容易讓人上癮),但這也證明了人工智能可以通過數據來學習和瞭解我們,進而優化推送我們想要的東西。這種優化讓已經在靠點擊賺錢的互聯網公司能賺到更多錢,比如谷歌、百度、阿里巴巴、YouTube、抖音。使用互聯網人工智能,阿里巴巴可以給用戶推薦他們想買的東西,谷歌可以列出用戶想點擊的廣告,抖音可以推薦用戶想觀看的視頻。

算法與編輯

第一波人工智能浪潮也帶來了全新的、由人工智能驅動的互聯網公司。在中國,這類公司的領頭羊是今日頭條。創立於2012年的今日頭條,有時被稱為「中國的Buzzfeed」,因為這兩個網站都是時下病毒式話題的傳播中心,但兩者相似的地方僅此而已。Buzzfeed有一群擅長炒作原創內容的年輕編輯,而今日頭條的編輯是人工智能算法。

今日頭條的人工智能引擎在互聯網上搜尋內容,使用自然語言處理和計算機視覺技術,消化整理來自合作夥伴及特約撰稿人的大量文章與視頻,再根據用戶的以往行為,如點擊、閱讀、瀏覽、評論等,針對每個用戶的興趣、喜好和習慣高度定制動態推送。這個人工智能算法甚至會修改標題,以吸引用戶點擊。用戶點擊量越多,今日頭條就越擅長推薦適合用戶的內容。這個良性循環,創造了互聯網上最誘人的內容平台之一——今日頭條的用戶平均每天在應用內逗留74分鐘。(1)

機器人報道與假新聞

除了高度定制推送,今日頭條也使用機器學習來創作與監管內容。2016年巴西裡約奧運會期間,今日頭條和北京大學合作開發了一名人工智能「記者」,可以在賽事結束後幾分鐘內撰寫出簡短的摘要報道。人工智能「記者」撰寫的文章不怎麼優美但速度驚人,有些賽事結束後兩秒鐘內,人工智能「記者」就完成了報道摘要,每天能報道30多項賽事。

算法也可以在平台上找出假新聞(通常是醫療類的假新聞)。起初,讀者會發現並舉報這類假新聞。後來今日頭條使用這些帶了標籤的數據來訓練算法識別假新聞。今日頭條甚至專門訓練一套算法來撰寫假新聞,然後讓兩套算法相互較量,看誰能騙到誰,在相互學習中優化算法。

使用人工智能處理內容的商業模式回報頗豐,以此為基礎的公司獲得了天價估值。2018年7月,《華爾街日報》報道今日頭條準備在香港上市,估值450億美元。預計今日頭條2018年營收在45億美元至76億美元。此外,該公司正快速拓展海外市場。2016年,今日頭條收購美國著名的社交新聞網站Reddit未遂,一年後收購法國的一個新聞集合網站News Republic,以及由華人團隊開發、廣受美國青少年喜愛的對口型音樂短視頻製作應用Musical.ly。

今日頭條的成功展現了中國在互聯網人工智能領域的實力。超過7億互聯網用戶都在消費中文互聯網內容。使用人工智能優化的在線服務使中國的互聯網巨頭獲利頗豐,如騰訊在2017年11月市值超越Facebook,成為第一家市值超過5000億美元的中國公司;如阿里巴巴快速成長,成為和亞馬遜勢均力敵的巨頭。

我預測在5年後,中國科技公司在互聯網人工智能技術發展和商業獲利方面,會取得微小的優勢。中國的互聯網用戶比美國和全歐洲加起來都多。而且移動支付的普及,使中國的互聯網用戶可以與內容創作者、O2O平台和其他用戶無縫連接,支付行為非常簡易。把這些結合起來,中國在開發互聯網人工智能應用及盈利方面能夠睥睨全球。再加上堅韌且資金充裕的創業者,中國很有可能(但是沒有絕對把握)勝過硅谷。

不過,第一波人工智能浪潮創造的種種經濟價值仍局限於高科技產業及數字世界。傳統公司廣泛地從人工智能發展中獲利,是在第二波人工智能浪潮來臨之後。

第二波浪潮:商業智能化

第一波人工智能浪潮的基礎是給互聯網用戶的瀏覽數據貼標籤,而商用人工智能則是給傳統公司數十年來積累的大量專業數據貼標籤,如保險公司理賠事故中鑒別保險欺詐,銀行核發貸款時記錄還款率,醫院保存醫療診斷記錄及患者存活率等。這些活動產生了大量帶有標籤,即自帶特徵及含義的數據。但直到最近才有部分傳統公司找到方法,更有效地利用這些數據。

商用人工智能從這些數據庫中挖掘人類往往會忽視的隱性聯繫,參考以往的決策與結果,利用貼了標籤的數據訓練算法,最終使其超越經驗最豐富的人類從業者。這是因為人類通常根據強特徵(strong features)來做出預測,而與結果高度相關的數據,通常是直接的因果關係。例如在預測患糖尿病的可能性時,此人的身體質量指數(BMI)是強特徵。而人工智能算法除了會把這些強特徵納入考慮,同時也不放過其他的弱特徵(weak features)——這些數據點可能表面上和特定結果無關聯性,但是把數千萬個例子結合起來後,可以發現一些對預測結果有幫助的重要聯繫。這些細微的關聯性往往沒人能解釋清因果,例如為何在星期三取得貸款的借款人往往能較快地償還貸款。但是,使用人腦難以理解的複雜數學關係,把許多強特徵和弱特徵結合起來的算法,能在許多商業分析工作上勝過技術頂尖的人類。

商用人工智能事業

早在2004年,帕蘭提爾(Palantir)及IBM沃森等公司就已經為企業與政府提供大數據分析服務。那個時期的商用人工智能應用高度集中在金融業等少數幾個靠高度結構化信息運作的產業。「結構化」的意思是已分類、貼上標籤、可搜索的數據,最典型的就是股價歷史信息、信用卡使用記錄等。這類產業有明確的優化指標,與人工智能天生契合。

因此,傳統產業發達的美國在早期的商用人工智能應用領域建立了強勢的領先地位。大型美國企業收集了大量數據,設計了良好的儲存結構。它們常使用會計、存貨管理及顧客關係管理等領域的企業軟件。有了這樣結構化的數據,如帕蘭提爾這樣的數據分析公司可以很容易地將人工智能商用,幫助傳統公司優化現有數據庫,更好地識別欺詐、更明智地進行交易、發現供應鏈上缺乏效率的環節,使得企業進一步節約成本,利潤最大化。

中國的企業大多使用自己特有的系統來保存數據,從未真正接納企業軟件或標準化的數據儲存。這些系統無法擴展,難以和現有的企業軟件整合,數據的整理與結構化非常困難。無結構的數據導致使用人工智能優化後的結果不甚理想。另外,中國公司在僱用第三方顧問服務方面的支出遠少於美國公司。中國許多傳統企業的經營模式和企業文化仍然像個體經營而不是現代企業組織,它們認為不值得在第三方的專業服務上花錢。

到了2013年,深度學習技術的應用大大提高了服務水平,市場上出現了新的競爭者,如加拿大的Element AI、中國的商用人工智能公司第四範式。

炒掉銀行客戶經理

中國大部分傳統企業普遍存在數據尚未結構化、企業文化老舊等現象,使其難以在第二波人工智能時期享受技術紅利。但一些能夠直接接入商用人工智能的產業在大步前進,小微金融就是其中最有前景的一個產業。過去中國的金融服務業以人力為主,小微金融產業成為直接採用尖端人工智能應用的一塊跳板。

微信和支付寶可以讓你直接從銀行賬戶轉賬付款,但它們的核心服務無法讓你在收入到賬之前,稍微透支一部分。這是因為當金融服務商越過信用卡直接進入移動支付時,無法同步利用信用卡發行商的信用數據。面對這樣的問題,智融集團(Smart Finance)研發的人工智能應用填補了這塊空白,它只依賴算法,就可以評估貸款的風險,並做出比人精確的判斷。它不要求申請人填寫收入水平,只要求用戶同意發貸方從他們的手機上取得一些數據。這些數據就像申請人的數字指紋,能夠以相當高的準確度預測他們有沒有能力償還1萬元的小額貸款。智融的深度學習算法不只看明顯的指標,如用戶的微信錢包裡有多少錢,它也根據一般銀行貸款審核人員認為無關緊要的數據點來做出分析,如用戶輸入出生日期的速度、手機電池還剩多少電量以及數以千計的其他數據。貸款申請人的手機還有多少電量跟他們的信用有關係嗎?這兩者間不是「因為……所以……」的因果關係,而是因為人類難以識別的海量數據中隱藏著關聯性,這正是人工智能擅長的領域。智融用數百萬筆貸款數據來訓練算法,這些貸款有些償還了,有些則沒有,發掘了和信用相關的數千個弱特徵。智融集團創始人兼CEO焦可把這些不尋常的指標形容為審核放款時的「新審美標準」(2),取代了個人徵信之類的傳統標準。

不斷增加的海量數據使算法不斷優化,也使智融能夠將信用服務延伸至那些向來被傳統銀行忽視的人群,如低收入年輕人及外來務工人員。智融集團的人工智能算法,預測違約率低至個位數。這一數字讓傳統銀行歎為觀止。

請到算法診所就診

商用人工智能並非只能用在跟錢有關的領域,它同樣可以用在數據驅動的公共服務上,讓許多之前負擔不起這些服務的人享受科技帶來的紅利,促成高質量服務大規模推廣。這方面,最具前景的領域之一是醫療診斷。美國的頂尖研究人員如吳恩達和塞巴斯蒂安·特倫,已經展示了一些依據影像在診斷某些疾病時媲美專業醫生的一流算法,如根據胸部X光片來診斷肺炎,根據照片來診斷皮膚癌等。不過,醫療領域商用人工智能的更廣泛應用,將有望處理多種疾病的整個診斷流程。

目前,擁有專業醫學知識以及能為患者做出正確診斷的人仍然以少數專業人士為主,但他們精力有限,記憶力也不能支持他們記住所有的病例與治療方法,一流的醫療服務仍然由為數不多且資金充裕的醫療機構提供。互聯網上雖然散佈著海量的醫學信息,但並不是以大眾能夠理解的形式存在。在人口眾多、醫療資源相對緊張的中國,訓練有素的醫生大多集中在大城市的一流醫院,在偏遠的城鎮或鄉村,醫療資源並不是很豐富。因此,中國各地的病患總是想盡辦法到北京、上海的大醫院看病,哪怕需要等很多天。這讓大醫院本就有限的資源更加緊張。

第二波人工智能浪潮有望改變這一切。疾病診斷涉及的數據(如症狀、醫療史、環境因素等)以及從與這些數據有關的現象(如某種疾病)中尋找關聯性並做出預測,這些工作正是深度學習擅長的。有了足夠的數據——精準的醫療記錄,由人工智能驅動的診斷工具能夠把一般水平的醫療專業人員變成處理過數千萬個病例的超級醫生,還能發現患者症狀數據之間隱藏的關聯性,同時還有完美的記憶力。

曾經在硅谷及百度從事深度學習工作的中國人工智能研究人員鄧侃,創立了大數醫達科技公司,該公司研發了專門訓練醫療領域的人工智能算法,使它們成為能夠部署在全國各地的超級診斷師。它們並不想用算法取代醫生,而是要輔助醫生診斷。算法在診斷流程中扮演「導航」的角色,用大數據規劃最佳路徑,但人類醫生會主導最終的判斷。診斷的範圍隨著算法得到的信息增加而縮小,這時更詳細、高度確定的數據可以幫助判斷症狀的起因,以及其他診斷結果的正確性及患病概率。這款應用給醫生的建議,是依靠其超過4億條醫療記錄(並且還在持續掃瞄最新醫學文獻)的數據,把全球頂尖醫學知識平均分配在醫療資源不均衡的社會中,讓所有醫生和護士都能聚焦在機器做不到的人類工作上,如使病患感受到關懷,更人性化地和病患分享診斷結果。

看不見的法庭助手

科大訊飛率先把人工智能應用在另一個資源和能力分佈高度不均的領域——司法界。在上海進行的試點中,科大訊飛使用以往案例數據,向法官提出有關證據及判決的建議。該公司開發的證據交互參照系統,使用語音識別與自然語言處理技術來比較所有證據,如證詞、文件及背景資料等,並找出其中的矛盾點,同時提醒法官注意這些有爭議的地方,讓法院審理人員可以進一步核實。量刑時,法官可以把被告的犯罪記錄、年齡、造成的傷害等相關信息輸入判決輔助人工智能系統。該系統存儲了大量的判決記錄,可以從類似案例中做出有關量刑或罰款的建議。接受人工智能應用提供的信息,可以在十萬餘名法官中建立一致性,也可以約束不走尋常路的法官。美國的一些法庭也會使用類似的算法,對提請假釋的犯人進行風險評估。不過,這類人工智能工具扮演的角色及其本身的缺乏透明性等缺陷,在美國高等法院遭到了質疑。

跟大數醫達科技公司的醫生「導航」一樣,科大訊飛的司法人工智能工具也是用來輔助專業人員做出更佳決策,而非取代專業人員。人工智能系統為法官提供數據導向的建議,幫助維持司法公正,糾正一些就連經驗豐富的法官都無法避免的偏見。美國的法律學者的研究表明,受害人及被告所屬的種族,對美國法院判刑的影響非常明顯,而司法偏見往往更不引人注意。一項針對以色列法官所做的研究結果顯示,這些法官在午餐前做出的判決比較嚴厲,在飽餐一頓後,他們在裁決假釋時則較為寬容。(3)

誰能取得領先地位?

那麼,在人工智能應用更廣泛的商用人工智能領域,哪一個國家處於領先地位呢?在今天無疑是美國。美國的公司有應用商用人工智能的原材料和意願,因此在見效快、最有利可圖的銀行業、保險業以及其他任何擁有大量結構化數據、可供人工智能進一步優化的產業上具有明顯優勢。相對來說中國傳統企業對人工智能的應用不是很到位,但中國現有的金融體制和分佈不均的醫療衛生資源是重構消費者信用和醫療等服務的關鍵所在。商用人工智能可以把這些弱點轉化為優勢,徹底重構這些產業。所以,我認為5年內中國能夠縮小差距,而且有機會讓商用人工智能發展出更多有效的應用。

第二波人工智能的應用對現實世界有直接影響,但算法本身處理的對象仍然是由人類行為形成的數據。但第三波人工智能改變了這一點,賦予了人工智能最寶貴的信息收集工具——眼睛與耳朵。

第三波浪潮:實體世界智能化

在人工智能問世之前,所有機器都是既盲且聾。它們可以拍照或錄音,但這只是複製人類感受到的視聽環境以供人類解讀,機器本身無法理解這些信息。對一台普通的計算機而言,一張照片只不過是它必須儲存起來的、沒有任何意義的一堆像素;對一部iPhone而言,一首歌曲只不過是它必須播放給人類聽的一串0與1的組合。

感知人工智能的問世改變了這一切,現在算法能夠模擬人腦的運作方式,把圖片或視頻的像素彙集成有意義的集群以辨識其中的對象,如金毛犬、交通信號燈、我們的親屬等。聲音數據也是如此,計算機不再只是把音頻檔案當成字節的集合儲存起來,人工智能算法能夠提煉出其中的字詞,還能解析整個句子的意思。

第三波浪潮就是把人工智能延伸至我們的生活環境,以大量的傳感器及智能型器材,把我們的現實世界轉化成可被深度學習算法分析與優化的數據,如小米的智能音箱「小愛同學」和Amazon Echo可以把聲音環境數字化;阿里巴巴的「城市大腦」通過攝影機和物體識別,可以把城市交通流量數字化;Face++的技術和軟件則可以把面孔數字化,使用感知數據,經過人臉識別來保護我們的手機或數字錢包。

界限模糊的OMO世界

感知人工智能開始模糊線上與線下世界之間的界限,大大增加了我們和互聯網的互動節點。在感知人工智能問世之前,我們和線上世界的互動必須經過兩個關卡:計算機鍵盤或智能手機屏幕。這些設備是通往儲存於互聯網上龐大知識的入口。但是這樣獲取信息很不方便,尤其是在外購物或正在開車時。

感知人工智能越來越擅長辨識我們的臉孔,聽懂我們的聲音,觀察我們身邊的世界,它也將在線上與線下世界之間架起無數無縫銜接的橋樑節點,這些節點會讓「上線」這個詞變得沒有意義。坐在沙發上說一句話,就能訂好外賣,那我們究竟有沒有在線上?當我們的冰箱告訴商店裡的購物車家裡已經沒有牛奶了,我們到底是在現實世界還是數字世界裡?

我把這個新環境稱為「線上線下融合」(Online-Merge-Offline),簡稱OMO。我們已經從純粹的電子商務邁入O2O(線上到線下)服務,下一個狀態則是OMO。這個過程中,每一步都在數字世界和現實世界之間建立新橋樑。OMO把數字世界和現實世界完全整合起來,把線上世界的便利性帶進線下世界裡,把在線下世界裡感知到的內容帶到線上世界裡。

未來,感知人工智能將把購物商場、雜貨店、城市街道甚至我們的住所轉化成OMO環境,還會產生一些令一般用戶真正有未來主義感覺的人工智能應用。有些應用已經存在了。中國的肯德基和支付寶合作,率先在一些店推出「刷臉支付」。顧客在數字終端機上點餐後,快速掃瞄臉孔,鏈接至他們的支付寶賬戶,直接轉賬付款,而不需要現金、信用卡或借記卡,更不要說掃瞄手機二維碼支付。這些人工智能的點餐機甚至使用「活體算法」(liveness algorithm),確保人臉不會被盜刷。

刷臉支付只不過是OMO的「冰山一角」。想知道OMO的發展趨勢,我們要來展望一下幾年後,安裝了感知人工智能設備的超市會是什麼樣的。

每輛購物車都知道你的姓名

「開復,您好!歡迎再度光臨永輝超市!」

購物車像老朋友一樣迎接我的感覺真不錯。我拉出一輛購物車時,購物車把手上的視覺傳感器已經完成了對我的面部掃瞄,同時在巨大的人工智能驅動的數據庫裡比對,與一份愛美食、愛購物、妻子非常會做中餐的檔案聯繫起來。

當我正絞盡腦汁回憶家裡這星期需要買什麼時,購物車把手上的屏幕亮了,上面的信息告訴我:「屏幕上顯示的是您每週常買的食品雜貨清單。」我們家日常的食物列表出現在了屏幕上:茄子、花椒、希臘酸奶、脫脂牛奶等。這時,我家的冰箱和櫥櫃已經檢查了這周需要什麼,自動下單了不易腐壞的食品雜貨(米、醬油、食用油等)提前快遞到家。這樣,永輝超市等商店可以針對用戶的習慣、喜好及需要,為用戶挑選新鮮農產品、特定品牌的紅酒、生鮮海產等,這也能讓超市縮小門店面積,在距離多數居民區較近的地方設置較小的門店。

「如果要從清單上增減任何商品,請告訴我。」購物車繼續說,「從購物車裡及家中冰箱裡的東西來看,您這周的飲食可能缺乏纖維,我是否該增加一包杏仁或者做豌豆湯的食材?」

「不要豌豆湯,但請快遞一大包杏仁到我家,謝謝!」雖然不知道算法需不需要感謝,但我還是習慣性地致謝。瀏覽清單後,我做出了幾項調整:女兒不在家,我可以刪除一些商品;冰箱裡有牛肉,我決定照我母親的食譜,為我的太太煮碗牛肉麵。

「去掉希臘酸奶,從現在起,改喝全脂牛奶。還有,我要做牛肉麵,把缺的食材加上去。」

我做出調整後,購物車立刻回答:「沒問題。」它說的是普通話,但聲音是我喜歡的女星詹妮弗·勞倫斯。這讓家務雜事做起來不再那麼枯燥乏味。

購物車在超市裡自動前進,一直和我保持著幾步的距離。我則在挑選最熟的茄子和味道最濃的花椒,這兩樣是麻辣牛肉麵的關鍵食材。接著,購物車帶我來到超市後方,精確控制的機器人正在製作新鮮麵條。我把商品放進購物車裡時,購物車邊上的深度感知攝像頭能識別出商品,而下方的傳感器會進行稱重。

購物車裡每增加一樣商品,屏幕上的列表就勾選掉這一項,並計算出目前的總價。超市裡每樣商品的擺放位置及陳列方式,都是根據過去收集的顧客購買數據來不斷優化的。什麼樣的陳列方式能吸引顧客的注意力?他們會在哪兒停下看商品?他們最終購買了哪些商品?視覺及商業數據讓人工智能超市能像在線零售商那樣,對消費者行為有充分的瞭解。

轉個彎,來到酒品陳列區,一名穿著制服的年輕人走了過來。

「李先生,您好!」他說,「我們店剛進來一批很棒的納帕(Napa)紅酒。我知道您太太的生日快到了,您初次購買作品一號(Opus One)酒莊2014年份的酒,可以打九折。您太太常喝前奏曲(Overture),Opus One是同一酒莊更高端的酒品,味道香醇,還有咖啡、黑巧克力的氣味,您想嘗嘗嗎?」

他知道我喜歡加州葡萄酒。我接受邀請嘗了一點,味道真的很棒。

「我很喜歡。」我把杯子還給他,「來兩瓶吧。」

「謝謝您。您可以繼續採購,我等一下就拿兩瓶給您。若您想定期採購,或是想試試其他的推薦,可以在永輝超市的應用裡找到,也可以來這裡找我。」

這裡的服務人員知識豐富、友善、訓練有素、精於營銷。這份工作對社交互動的需求遠超傳統超市的服務人員崗位,所有員工都要隨時和顧客討論烹飪、從農場到餐桌的供應鏈以及比較某款產品和顧客用過的其他產品。

購物還在繼續,購物車引導我購買日常的食材,服務人員偶爾會推銷一些算法預測的、我可能願意嘗試的東西。服務人員把我購買的東西裝袋,這時我的手機振動了,是微信完成支付的提示。完成後,這台購物車自行導航,回到了購物車架上。

類似這樣由感知人工智能驅動的購物經歷,呈現了人工智能時代的一個根本矛盾:令人感覺既尋常,卻又全然不同於以往。我們的日常活動大多一如往常,但現實世界的數字化將減少平時出現的摩擦,並為每個人提供量身定制的服務。線上世界的便利也會來到線下世界。同樣重要的是,通過瞭解及預測每位購物者的習慣,商店可以大大改進供應鏈,減少浪費,提升效率,提高盈利能力。

這裡描繪的超市已經快變成現實了,創新工場旗下的創新奇智與永輝超市合作策劃了一個相關項目,希望能盡快把這樣的願景帶到大眾身邊。核心技術已經存在,只等軟件進一步調試、供應鏈後端的整合以及建造商店了。

OMO驅動的教育

身歷其境的OMO體驗並非僅限於購物。相同的技術如視覺識別、語音識別,以及根據以往行為勾勒的詳細個人檔案,也可用來創造高度定制的教育體驗。

現行的教育體系大致上仍然是19世紀的「工廠模式」:所有學生在同一地點、同一時間,以相同速度及相同方式學習。學校採用「流水線」模式,讓孩子一年升一級。在老師投入教學、輔導與評估學生的時間與精力非常有限的情況下,這種模式是有道理的。

但現在人工智能可以消除這些限制,人工智能的感知、識別與建議能力,能夠針對每個學生打造不同的學習流程,也可以讓老師騰出更多時間,對學生提供一對一輔導。

人工智能驅動的教育有四種應用場景:課堂教學、家庭作業與練習、考試與評分、量身打造的家教輔導。這四種場景的效果及行為會反饋給人工智能,並構成這一應用的基石——學生個人的檔案。檔案中包含影響學習的各種因素,比如哪些概念很熟悉,哪些概念不好理解,對各種教學方法的反饋,在課堂上的專注程度,回答問題的速度如何,調動學生積極性的方法,等等。

如何收集數據?如何應用於改進教育流程?

在課堂教學中,學校將採用「雙教師」模式:一位優秀的教師遠程授課,另一位教師在教室觀察與輔導。課程的前半部分,是教師對大約20個課堂的學生遠程授課,並向學生提出問題,而學生要使用手上的「答題器」回答這些問題,讓授課教師實時瞭解學生是否理解了之前講授的概念。

在授課過程中,教室前方的一個視頻會議攝像頭使用面部識別與動作分析技術來記錄出席人數,檢查學生的專注程度,並根據學生的動作(例如點頭、搖頭、困惑的表情等)來評估學生對授課內容的瞭解程度。所有的數據,如用機器回答的問題、專注程度、理解程度,將直接寫入學生的個人檔案裡,實時反饋學生瞭解了哪些授課內容,以及哪些部分需要進一步講解。

學生回家後,算法根據學生檔案,為每個學生量身設計家庭作業:聰明的學生必須完成高難度、有挑戰的題目;不太理解教材的學生則會做些更基礎的題目,或許還要額外補課。

這個過程中的每一個環節,如學生對不同題目的解答所用的時間及答題表現,都會寫入他們的檔案裡,並據此調整後面的題目,增強學生的理解。此外,對於英文這類課程,人工智能語音識別技術能把一流的英文教學帶到偏遠地區。高性能語音識別算法可以評估學生的英語發音,即使沒有以英語為母語的教師,也能幫助學生改進語音語調。

從教師的角度看,這些工具可減輕批改作業的負擔,讓他們有更多時間關心學生的其他方面。中國的七天教育公司已經在使用感知人工智能的視覺識別能力,研發對復選題及填空題打分數的掃瞄儀,甚至還可以自動標示論文中的拼音、語法之類的常見錯誤,並根據預設的標準來扣分。這種人工智能技術能節省教師批改基本錯誤的時間,用來和學生溝通較高層次的問題。

最後,對於學習落後的學生,人工智能系統裡的學生檔案會自動通知家長,詳細說明他們對哪些概念理解困難。家長可以根據這些信息,選擇遠程輔導服務,例如為中國學生提供美國教師在線授課的VIPKID。遠程輔導服務存在已久,但現在感知人工智能讓這些平台持續通過表情及情緒分析,收集學生投入程度的數據,並將這些數據持續寫入學生的檔案裡,幫助平台選擇能讓學生更加投入的教師。

上述所有工具大多已經存在並開始應用在中國各地的課堂上。這些工具結合起來,將構成新的人工智能驅動型教育模式,融合線上與線下世界,創造出針對每個學生的不同需求的學習體驗。在教育領域,中國已經領先美國一大步。信奉傳統觀念的中國家長會在孩子教育上進行大筆投入,中國高考的激烈競爭以及質量參差不齊的公共教育體系進一步加強了這樣做的理由。短短幾年,這些家長的投入已經讓VIPKID之類的公司有了超過30億美元的估值。

公共數據與個人隱私

打造OMO體驗,需要從現實世界中收集海量數據,例如想使用阿里巴巴的「城市大腦」優化交通,就需要城市各個位置的視頻資料;想為某個顧客量身打造OMO零售體驗,需要先通過面部識別系統來確認身份;想讓用戶的聲音與在線服務互動,需要能聽懂人類語言的技術。

這樣收集數據可能會令許多美國人感到不安,他們不想暴露太多的個人隱私。但中國人更容易接受自己的面孔、聲音及購物選擇被記錄與數字化,更願意用個人的信息來換取便利。中國的各大城市已在使用大量的攝影機與傳感器網絡。這個監控網絡把視頻數據直接導入負責管理交通、公安以及緊急服務的優化算法中。

如何在個人隱私和公共數據之間求得平衡,取決於每個國家的抉擇。歐盟通過了《通用數據保護法案》(General Data Protection Regulation)(4),規範並約束了在歐盟內收集和使用數據的行為,採取了最嚴格的數據保護措施。美國繼續對用戶隱私施行保護,從Facebook的「劍橋分析」事件及之後的一系列聽證會就可見一斑。中國2017年開始實行的《中華人民共和國網絡安全法》(5),也規定了要對非法收集、買賣用戶數據的行為進行處罰。

為了更多的便利性及更好的安全性,社會監控需要做到什麼程度呢?這個問題沒有「正確答案」。但從短期的影響來看,中國用戶對於在公共場所收集個人數據相對接受,將使其在感知人工智能的推行上具有很大的起步優勢。中國正在加快城市環境的數字化,這樣做為OMO在零售、安保及交通等領域的應用開啟了大門。

不過,把感知人工智能應用於這些領域,需要的不僅僅是攝像機和數據。不同於互聯網人工智能和商用人工智能,感知人工智能非常依賴硬件,想把醫院、汽車及廚房轉變為OMO環境,我們需要裝配傳感器的硬件與器材,使現實世界和數字世界同步。

深圳製造

硅谷或許在軟件創新方面仍領先全球,但硬件創新卻是深圳在領跑。過去5年間,這個位於中國南方沿海的製造業大都市,已經發展出了全球最有活力的智能硬件製造業生態系統。開發一款新的應用程序,幾乎不需要現實世界的工具,只需要一台計算機和一名有好點子的程序員。但研發感知人工智能硬件,如有眼睛的購物車、有耳朵的音響,則需要一個堅實且靈活的製造業生態系統,包括傳感器供貨商、注模工程師、小批量生產的電子工廠在內的成熟流水線。

現在,中國製造業的最大優勢不是廉價勞力,印度尼西亞及越南之類的國家的工資更低。中國製造業現在的最大優勢是無可匹敵的供應鏈靈活性,以及能夠研發出新器材的原型並且量產優秀的工程師。

這一優勢把深圳從一個加工業聚集地轉型為無人機、機器人、穿戴式設備及其他智能設備製造的創業聖地。在深圳令人眼花繚亂的電子產品市場上,有數千種電路板、傳感器、擴音器、迷你攝影機供創業者挑選。一旦研發出原型,他們可以從數百家工廠中找到能小批量生產或大規模生產的工廠。零件供貨商及產品製造商同處一地,加快了創新流程。硬件創業者說,在深圳的一星期,等同於在美國的一個月。

深圳歡迎全球的硬件創業公司落戶,但中國本土創業公司還是有著主場優勢。語言障礙、簽證核發、遠離公司總部等因素,將減緩美國創業公司在這裡發展的速度,同時也增加了它們的產品成本。蘋果之類的大型跨國企業有足夠的資源,能夠充分利用中國的製造業,但對其他外國創業公司而言,一個個的小障礙組合起來可能很致命。而深圳的中國本土硬件創業公司則如魚得水,可以自由地實驗,維持相對低成本的運轉。

小米先行

中國的硬件創業公司小米展示了感知人工智能設備構建的場景。以低價智能手機製造起家,進而席捲全中國的小米科技公司,現在正在打造把廚房及客廳轉變成OMO環境的人工智能家電網絡,其中的核心是小米人工智能音箱「小愛同學」——一款類似Amazon Echo的聲控設備,但由於是中國製造的,價格只有Amazon Echo的一半左右。之後一系列智能型感應式居家設備,如空氣淨化器、電飯鍋、冰箱、攝影機、洗衣機、吸塵器都藉著低成本的優勢成功上市。小米並非全憑自己研發這些設備,它投資了220家公司,孵化了29家創業公司(大多位於深圳)。這些創業公司的產品結合起來,構成了一個平價的智能家電生態系統,通過Wi-Fi連接,方便用戶設置。小米用戶用聲音或手機,就能控制整個智能家電生態系統。

低價、多樣性與人工智能的結合,創造了全球最大的智能家居設備網絡。截至2017年年底,小米的物聯網家居設備賣出8500多萬台。(6)2018年7月9日,小米公司在港交所上市,以當天收盤價格計算,公司的市值為479億美元。這也是一個以「深圳製造」為基礎的生態系統,低價和中國龐大的市場為小米收集數據增添助力,形成一個更強大的算法、更聰明的產品、更好的用戶體驗、更多銷售、更多數據的良性循環。

隨著感知人工智能應用在更多硬件上,每個家庭都將產生基於現實世界的數據,並根據這些數據進一步運作。人工智能冰箱發現牛奶快喝完時會自行訂購;人們可以用聲音控制咖啡機煮咖啡;如果上了年紀的父母跌倒了,人工智能地板會立刻通知你。

第三波人工智能產品即將改變我們的日常生活環境,模糊數字世界與現實世界的界限,直到界限完全消失。在這個轉變過程中,中國人對數據隱私的開放心態以及深圳的硬件製造實力,將使中國在感知人工智能上相對於美國的優勢,不出5年就將從今天的六四開,達到八二開。與此同時,第三波人工智能創新也將為第四波完全自主化的人工智能奠定基礎。

第四波浪潮:自主智能化

機器能夠看到和聽到我們周邊的世界,就可以安全地移動且有效率地工作了。自主人工智能是前三波人工智能浪潮的集大成者,也是頂峰,把極複雜的數據和機器感知能力結合起來,就會得到不僅能瞭解世界,也能改變世界的機器,比如盡人皆知的自動駕駛汽車。不過,在討論自動駕駛汽車之前,我們應該把目光放長遠,看看第四波人工智能浪潮的影響有多深、多廣。

自主人工智能設備能徹底改變我們絕大部分人的日常生活,包括購物商場、餐廳、城市、工廠、消防隊等。跟其他三波人工智能浪潮一樣,第四波人工智能浪潮帶來的改變也不會瞬間發生。早期的自主機器人只能在可以立即創造經濟價值的高度結構化環境中運作,主要是工廠、倉庫及農場。

有讀者會問:「這些領域不是已經實現自動化了嗎?重型機器不是已經接手許多藍領的工作了嗎?」是的,發達國家已經基本用機器取代了人力,但這些機器只是初級機械化。它們能夠重複某個動作,但無法做決策或處理突發情況。它們不能聽也不能看,必須由人來控制,或是只在單一、不變的軌道上運行。它們能夠執行高度重複的工作,卻無法應付偏差或異常。但是當人工智能賦予機器視覺、觸覺,以及使用數據來優化的能力時,機器能夠處理的工作範圍就大大增加了。

草莓園與機器甲蟲

采草莓聽起來似乎很簡單,但是在自主人工智能出現之前,尋找、判斷以及摘采草莓根本不可能自動化,只能靠幾萬名低薪勞工,整天彎腰駝背地在草莓園用眼睛與雙手勞作。這個工作既辛苦又枯燥,加州許多農場主找不到願意做這個工作的工人,只能眼睜睜看著草莓在地裡腐爛。為了解決這個問題,加州的創業公司Traptic研發出了能夠勝任這個工作的機器。將這個機器架在一台小型拖拉機上,使用先進的視覺算法,在無數葉子中尋找草莓,查看草莓顏色以判斷草莓的成熟度,並用機器手臂輕巧地從籐上摘下草莓,完全不傷及果實。

亞馬遜的倉儲中心也是一個很好的例子。僅僅5年前,亞馬遜的倉儲中心還是傳統倉庫的樣子:一排排固定的貨架,員工步行或駕駛小車,沿途拿取貨架上的貨物。現在,員工在原地不動,貨架會主動來到他們面前。現在的亞馬遜倉儲中心地板上,有許多甲蟲般的機器人,舉著商品貨架快速行進。這些機器甲蟲到處穿梭,彼此之間擦肩而過,把商品貨架運至揀貨員面前。員工只需從貨架上揀取商品,掃瞄後放進箱中。這場景就像人類站著不動,而在他周圍上演著一場精心設計的機器人芭蕾舞。

這些機器人有一個共同點:它們為所有者創造直接的經濟價值。自主人工智能將首先應用於商業領域,因為這些機器人創造了可預見的投資回報,它們執行的是人工成本更昂貴或是找不到人執行的工作。

在美國,家政工作者如清潔工、廚師、護理員等也大致符合這一類別,但短時間內自主人工智能還無法用在家政服務上。儘管科幻片讓我們相信家政機器人很快就會問世,但實際上還差得很遠。我們雜亂的生活環境對不靈巧的機器人來說就像障礙訓練場。清理房間或做飯之類的工作看似簡單,其實已經遠遠超出人工智能目前的能力。

蜂群智慧

不過,隨著自主人工智能越來越靈巧、越來越有智慧,會出現更多不可思議的應用,尤其是在無人機方面。成群的自主無人機能夠一起合作,用幾小時的時間就能粉刷好房子的外牆。耐熱的無人機群可以合力撲滅森林火災,效率是傳統消防隊的數百倍。另外,無人機也可以在颶風及地震後進行搜救,把食物及水遞給受困者,或者和附近的無人機合作,把受困者空運出來。

毫無疑問,中國將在自主無人機技術領域取得領先地位。大疆創新科技公司(DJI)的總部在深圳,該公司是全球最大的無人機製造商,知名科技新聞工作者克裡斯·安德森(Chris Anderson)曾讚譽該公司是他所見過的最棒的公司。(7)據估計,大疆創新已佔據50%的北美無人機市場,在高端市場的佔有率更高。該公司在研發上投入了龐大資源,已經開發出一些工業及私用的自主無人機。蜂群智慧技術目前雖然剛剛起步,不過和深圳無可匹敵的硬件生態系統結合起來後,效果會非常驚人。

無人機群將改變我們的天空,而自動駕駛汽車將改變我們的道路。這些科技革命還將延伸至交通運輸之外,改變城市環境、就業市場,以及我們的日常生活。包括谷歌在內的一些公司已經證明,自動駕駛汽車將遠比人工駕駛更安全、更有效率。現在,數十家創業公司、科技巨頭、傳統汽車製造公司以及電動車製造公司都爭相力圖把這項技術商業化。谷歌、百度、Uber、滴滴、特斯拉以及許多其他公司紛紛組建團隊,測試技術,收集數據,準備把人類駕駛員趕下駕駛座。這場競賽中有兩個領跑者——谷歌下屬的自動駕駛公司Waymo,以及特斯拉,它們分別代表不同的技術應用模式,而這兩種模式也體現了人工智能超級大國美國與中國的不同政策。

谷歌模式與特斯拉模式

谷歌是第一家研發自動駕駛技術的公司,但大規模應用的腳步有些緩慢。這種謹慎態度背後的理念是:打造出完美產品,在自動駕駛的安全性大大超過人類駕駛後,再直接躍入人工智能全自主化。這是一種完美主義的模式,不允許任何危及人類生命或企業聲譽的可能發生。埃隆·馬斯克的特斯拉則採取漸進模式:在部分功能(高速公路上自動駕駛、自動轉向以避免車禍以及自動泊車等)開發完成後,就馬上應用在自己生產的汽車上。這種漸進模式加快了商業化節奏,同時也帶來了一定程度的風險。

這兩種模式背後的驅動力都是數據。自動駕駛汽車必須用數百萬,甚至數十億公里的駕駛數據來訓練,使它們學會辨識物體,預測車輛及行人的動作。這些數據來自無數路上行駛的車輛,然後全部輸入中央的「大腦」——做出決策的核心算法集群。這意味著,任何一輛自動駕駛汽車遭遇新狀況時,所有依靠這些算法驅動的汽車都能同步學習新案例的處理方式。

谷歌在收集這部分資料的過程中,採取緩慢穩定的步速,他們用小規模車隊裝備高級傳感設備,上路測試、收集數據。特斯拉則在其商業車款上安裝較便宜的設備,讓車主在使用特定自動駕駛的同時,也為特斯拉收集了數據。這兩種不同的模式導致谷歌與特斯拉的數據收集量產生了巨大差距。截至2018年6月,谷歌花了8年收集到800萬英里的現實世界駕駛數據,而特斯拉僅用了2年就收集到12億英里的現實世界駕駛數據。

也許是感受到來自特斯拉及其他對手的競爭熱度,最近谷歌的模式向特斯拉靠近了一些,加快了全自動駕駛汽車的應用,而自2016年5月的一起事故(特斯拉車主因自動駕駛遭遇車禍身亡)後,特斯拉在自動駕駛的應用上反而放慢了腳步。不過,兩種模式的根本差異還存在。儘管谷歌研發的系統在有些場景已經比人開車更安全,他們仍然在追求無懈可擊的安全性,犧牲了應用速度。特斯拉實行更加技術權宜性的模式,一旦自動駕駛在某一方面超過了人類駕駛員,就立刻應用在現實中,希望用更快的速度搜集數據,把算法訓練得更好,以拯救更多的生命。

中國的特斯拉模式

中國有13.8億人口,平均每年有26萬人死於車禍。與其等待完美的自動駕駛問世,中國更願意在可控的環境中使用性能有限的自動駕駛汽車。而這種策略的「副作用」就是數據收集量呈指數成長,連帶推動人工智能技術的精進。

漸進應用模式的關鍵是興建新的基礎設施以容納自動駕駛汽車。美國的做法是根據現有道路研發自動駕駛汽車。中國則在調整現有道路,改變貨車形態,甚至建設能夠容納自動駕駛汽車的新城市。比如,浙江省已經宣佈計劃興建全國第一條智能超級高速公路,一開始就可容納自動駕駛汽車及電動車。這項計劃將整合道路、車輛與駕駛人之間的傳感器及無線通信,使汽車行駛的速度提高20%至30%,並顯著減少車禍事故。這條超級高速公路將在路面鋪設光伏板,把集成的太陽能輸送至充電站,供電動車充電,長期目標是讓電動車能夠在行進間持續充電。此計劃若成功,可加快自動駕駛汽車及電動車的應用。在自主人工智能駛入都市混亂的交通之前,可以先在高速公路上試驗,並在這個過程中收集更多數據。

再如位於北京以南100千米處的雄安新區,該區域包含了原屬於三個縣的一片寂靜村鎮。現在,在中央政府的政策引領下,這個地區將興建為展示科技進步與環境可持續發展的示範城市。政府預計投入約4萬億元人民幣的基礎建設經費(8),吸引250萬人口遷移至此,相當於芝加哥的人口總量。從無到有地建造一個新的芝加哥,這種壯舉在美國不可想像。但在中國,這只是城市規劃的一項手段而已。雄安新區將成為全球第一個從開始就容納自動駕駛汽車的城市,百度已經和當地政府簽約,打造「人工智能城」,聚焦於交通管理、自動駕駛汽車及環境保護。混凝土中需要加入傳感器,交通信號燈裝備計算機視覺硬件,十字路口可以知道每一位行人的年齡,泊車所需的空間明顯減少。當人人都能隨時隨地召喚自動駕駛的出租車時,甚至可以把停車場改成城市公園。

像雄安新區這樣全新建造的城市甚至可以更進一步,把市中心的交通運輸搬至地下,地面保留給行人及自行車。這種可控環境內的自動駕駛將比人類司機更安全。人工智能接手交通管理及自動駕駛汽車後,整個地下交通網甚至可以逼近高速公路的速度,而地面上的生活則還是人類的節奏。若計劃可以實現,類似這樣的新城市將與自主人工智能一起成長。它們在享受自主人工智能技術帶來高效的同時,也會回饋給算法更多的數據。美國現有的基礎設施要求自主人工智能必須先適應並應用於現有的城市,但在中國,政府的積極作為把應用變成了城市與人工智能共同進化。

圍繞自主人工智能技術的較量

在自動駕駛汽車的核心技術方面,美國的公司仍然領先中國企業兩三年。在科技界,這個差距可以說是天文數字了。美國領先地位的構成部分源自大量的頂尖專業技術人才。在第四波人工智能浪潮中出現安全問題的複雜性,使研發自動駕駛汽車成為很難攻克的工程難題,這需要世界一流的工程師團隊。這使得優勢倒向了美國,因為全球最優秀的工程師仍然聚集在谷歌之類的公司。谷歌早在2009年就開始測試自動駕駛汽車,谷歌的許多工程師後來獨立創立了自動駕駛汽車創業公司。中國到2016年左右才開始出現自動駕駛汽車創業公司。不過,百度之類的巨頭和北京初速度科技(Momenta)及馭勢科技(UISEE)等自動駕駛汽車創業公司正在技術與數據方面快速迎頭趕上。百度的「阿波羅計劃」——與50家自動駕駛汽車領域的夥伴合作及分享數據的開源平台,包括英偉達等芯片設計公司和福特及戴姆勒(Daimler)之類的汽車製造商,這與Waymo的封閉模式形成了鮮明對比。

究竟哪個國家將在自主人工智能領域取得領先地位,主要取決於一個問題:全面應用這些新技術的主要瓶頸是技術本身還是政府政策?如果是技術,那麼谷歌的Waymo有可能先於競爭對手解決這個問題。不過,如果計算機視覺等領域的每個新進展快速傳播,這相當於整個行業的技術水平整體水漲船高,那麼硅谷在核心技術上的領先地位可能變得無足輕重。這麼一來,許多公司都將能夠打造出安全的自動駕駛汽車,中國的一系列特斯拉風格的政策將佔據優勢。

當下,我們還不知道瓶頸將出現於何處,第四波人工智能競賽的局勢還不明朗。我個人認為,美國和中國在自動駕駛汽車這個領域勝出的機會是五五開,至於自主無人機之類的硬件密集型應用領域,中國將具備優勢。上圖是我對中、美兩國在四波人工智能浪潮中的實力評估,包含當下以及5年之後的發展趨勢。

中、美兩國在四波人工智能浪潮中的實力評估及未來5年發展趨勢

征服當地市場&武裝當地公司

目前,人工智能領域的應用發展大致局限在中、美兩國,而絕大多數未來的人工智能用戶仍然生活在其他國家(主要是發展中國家)。因此,任何想成為人工智能時代巨頭的公司,都需要一套爭取這些用戶以及在當地市場制勝的策略。

中國和美國的科技公司在進軍全球市場時,實行了差異很大的策略:美國那些稱霸全球的巨頭希望親自征服市場,而中國的科技公司則選擇武裝當地的創業公司。谷歌、Facebook、Uber之類的硅谷巨頭想在這些市場上直接推出它們全球一體化的產品(只對產品進行有限的本地化)。這種孤注一擲的方法如果成功,收穫當然會巨大,但空手而歸的概率很高。

中國的公司避開了直接競爭,轉而投資硅谷公司試圖消滅的當地創業公司。比如在印度及東南亞,阿里巴巴和騰訊投資了當地與亞馬遜等巨頭競爭的本土創業公司,這是中國智慧的體現。馬雲等中國的創業家深知,強龍不壓地頭蛇。因此,在進軍國外市場時,中國的公司不會試圖消滅當地的創業公司,而是與之組成聯盟。

從中國市場打到國際市場的共享出行

中國公司的全球化策略在共享出行市場已經啟動。這可以總結為人工智能全球化的另一種模式:結合人工智能技術與當地的數據,對當地創業公司賦能。這種以合作為基礎,而非征服的模式,或許更適合把人工智能這類需要頂尖工程師、由下而上收集數據的技術推廣至全球。

滴滴把Uber「趕出」中國市場後,便開始在其他國家投資當地創業公司,和它們聯合對抗Uber。如美國的Lyft、印度的Ola、新加坡的Grab、愛沙尼亞的Taxify、中東的Careem等。滴滴在2017年投資了巴西的99Taxi,之後在2018年年初完全收購該公司。這些當地創業公司依靠中國資金和經驗,結成了對抗Uber的全球聯盟。在接受滴滴的投資後,當地一些創業公司甚至根據滴滴改造自己的應用,其他創業公司則計劃利用滴滴在人工智能領域的長處,優化司機與乘客的匹配算法、自動調解司機與乘客的糾紛,未來也許會推出自動駕駛。目前尚不清楚這些技術交流有多深入,但人工智能需要的本地化程度遠高於早期互聯網服務。印度的自動駕駛汽車必須學習行人在班加羅爾街道穿梭的習慣,在巴西的小微金融的應用必須瞭解裡約千禧一代的消費習慣……算法可以適用於不同的用戶群,但各地現實世界的數據是獨一無二、無可替代的。

雖然硅谷公司對這些國家的特殊國情也有調查,並做了相關分析,但是研發商用人工智能、感知人工智能及自主人工智能產品,公司必須更深地扎根當地市場。創業公司必須安裝相關的硬件器材,根據北非消費市場或印度尼西亞醫院的特性,把人工智能服務本地化。遠在硅谷的企業通過代碼散佈全球影響力,恐怕不是長久之道。

當然,沒人能預知全球人工智能競賽的結果。美國的公司可能加大本地化投入,利用好現有產品,最終拿下中國以外所有國家的市場。發展中國家新一代的堅韌創業家也可能利用中國企業的支持,打造出硅谷巨頭無法滲透的當地市場。如果後者可以成真,中國的科技巨頭並不會稱霸全球,但可以在各地扮演重要角色,使用來自多個市場的數據改進算法,並且從豐厚的利潤中分一杯羹。

展望未來

縱觀當今人工智能領域,可以看到一股即將衝擊全球經濟、使地緣政治天平傾向中國的技術潮流。傳統的美國公司在使用深度學習,為現有商業獲取更多利潤的方面做得很好,谷歌等由人工智能驅動的公司仍然是精尖技術的堡壘。但在建造新的互聯網帝國、改變疾病診斷的方式,或者重構購物、出行及飲食場景等方面,中國更可能取得全球領先地位。中國與美國的互聯網公司在面對全球各地的市場時,採取了不同的模式與策略,隨著人工智能服務散播至全球的每個角落,它們可能在印度、印度尼西亞、中東及非洲部分地區「短兵相接」。

這一分析結果揭示了漸漸浮現的人工智能世界的秩序,但也凸顯了我們探討人工智能發展時的一個盲點,單純競爭的表面下還潛藏著更重要的問題:人工智能力量進入我們的世界後,真正的分歧不在國家之間,而在每個國家內部。


(1) 「Toutiao, a Chinese News App That』s Making Headlines」, Economist, November 18, 2017, https://www.economist.com/news/business/21731416-remarkable-success-smartphone-app-claims-figureusers-out-within-24.

(2) 2017年10月我和焦可的談話。

(3) Shai Danziger, Jonathan Levav, Liora Avnaim-Pesso, 「Extraneous factors in judicial decisions」, PNAS 108, no. 17 (2010): 6889—6892, https://www.pnas.org/content/pnas/108/17/6889.full.pdf.

(4) 《通用數據保護法案》,https://eur-lex.europa.eu/legal-content/EN/TXT/?qid=1528874672 298&uri=CELEX%3A32016R0679。

(5) 《中華人民共和國網絡安全法》, https://www.npc.gov.cn/npc/xinwen/2016-11/07/content_2001605.htm。

(6) 容承:《小米米家成立兩週年:聯網設備超8500萬台》,IT之家,2018年3月29日,https://www.ithome.com/html/it/353231.htm。

(7) 《相愛相殺?大疆要與昔日對手「在一起」》,新華網,2017年8月3日,https://www.xinhuanet.com/world/2017-08/03/c_129671051.htm。

(8) 《瑞銀:雄安新區20年投資規模料達4萬億》,鳳凰財經,2017年4月5日,https://finance.ifeng.com/a/20170405/15285421_0.shtml。