讀古今文學網 > 終極智能:感知機器與人工智能的未來 > 第一章 什麼是人工智能 02. 人工智能、機器學習和認知計算與人類智能的比較 >

第一章 什麼是人工智能 02. 人工智能、機器學習和認知計算與人類智能的比較

最近,人們對人工智能的興趣大增。在主流媒體中,認知計算、機器學習等幾乎就等於人工智能。我們需要瞭解這些術語的真正含義,因為它們並不是人工智能的另一種名稱。瞭解這些術語之間的差異有助於我們區分機器智能與人類思維。

人工智能由約翰·麥卡錫和馬文·明斯基在1956年的達特茅斯夏季會議上正式建立,這個會議的主題包括數學、博弈論和邏輯等。15人工智能是一個廣泛的研究領域,它一般涵蓋可以使機器具備推理、學習和行為智能的多種技術。其中一些技術的運行要基於系統建造時編寫的知識和規則集;有一些技術則使用「試探法」,即通過合理推測從大量可能的選項中選出最合理的選項;還有一些技術先做出核心假設,然後考慮新的信息,從而一邊工作一邊「學習」。

無論是否從數據中學習,人工智能都是一門關於智能算法的跨領域學科,而機器學習是人工智能的一門子學科,專指從數據中學習的算法。機器學習可以被分為多種類別。比如「監督式學習」是以一組事先貼標的示例表示的算法,這種算法可以確認數據和貼標結果之間的關聯或類別。在「無監督式學習」中,則無法使用事先貼標的示例集,而是使用無貼標或無分類的數據。打個比方,「監督式學習」就是給它很多貓和狗的照片,每張照片上都標注這是貓還是狗,然後讓它區分之後的圖片中是貓還是狗。「無監督式學習」與之相反,它的目標是突出一大批貓和狗的照片的區別,而這些照片上並沒有標注圖片中是貓還是狗。

機器學習技術利用每個示例中的特徵或屬性,最終要實現的目標是正確地貼標或分類,比如哪些特徵可以用於區分貓和狗的照片。當提供更多貓和狗的照片時,機器學習算法會嘗試建立模型,分析哪些基本辨別要素或特徵是區分貓和狗的可靠指標。

現在,我們來想想具有行為智能但不從數據中學習的算法。這方面的案例有某些國際象棋算法,這些算法已包含國際象棋的規則和一些區分有利或不利局面的方法。如果無法準確、科學地確定局面的有利程度,就可以使用「試探法」或直覺規則。

比如在一般情況下,和對手相比,剩下的棋子越多就越有利,同樣,確保皇后存活也更有利,而被將軍則不利。國際象棋算法可以通過國際象棋規則,算出棋手根據當前情況可能採取的所有走法,並對每一種走法進行評分,無論是有利的還是不利的,均不例外。它還可以選擇最有利的走法,並且重複進行這樣的選擇,直到勝利或失敗。該過程之所以如此簡單,原因之一在於,只計算之後的一步棋並不足夠,它可能需要計算之後的好幾步棋,一般情況下,一種算法就通過這種方法展示看似智能的行為,但它不會從結果或新的信息中學習。

最後是認知計算。這個術語直到20世紀80年代才開始被學術界所使用,但計算機行業早已開始使用這個詞,這是因為IBM(國際商用機器公司)曾利用這個說法推廣其「沃森」(Watson)系統。認知計算這一工作領域最貼切的定義就是:探索如何使用受人類大腦啟發的機器學習技術。因此,認知計算包括硬件和軟件兩個層面。事實上,在IBM開展的關鍵項目中,屬於認知計算的有TrueNorth架構(這種新型處理器嘗試使用硅複製人腦結構)以及更為大家熟知的「沃森」軟件。

通過上述例子,我們清楚地瞭解到這些智能算法的行為方式與人類大腦截然不同。比如,我們假定的國際象棋算法會根據單一的、實時的狀態和國際象棋規則知識,建立所有可能的走法或至少建立一個極大的子集,而人腦無法做到這一點。我們往往會「刪除」大量的可能性,因為一些可能性完全是荒謬的,甚至是不值得考慮的。相比於人腦,高性能計算機中的算法可以探索更多的可能性。雖然人腦可以同時處理多項任務並擅長多種認知任務,但人類大腦的「運行頻率」慢於硅處理器,因此人腦執行純數學任務的速度較慢,準確性也較低。在有些情況下,計算機和人腦之間的這一區別,也就是探索「所有選項」的能力的區別,是計算機的一項巨大的優勢。

1982年,斯坦福大學的研究人員道格拉斯·萊納特(Douglas B. Lenat)、威廉·薩瑟蘭(William Sutherland)和詹姆斯·吉本斯(James Gibbons)在《人工智能雜誌》(AI Magazine)上發表了一篇論文,該論文展示了生成和分析大量可能性的能力,讓人們認識到一種新類型的三維微電子設備。16而在此之前,人類研究人員從未找到這一發現。該發現由一個名為「Eurisko」的算法自動生成,這種生成和分析可能性的能力在斯坦福大學教授約翰·科扎(John Koza)開創的基因算法研究中得到了最大限度的發揮。2006年,科紮在《科技新時代》(Popular Science)發表了一篇文章,與大眾分享了他的成果。17這篇文章的標題雖然有些誇張,但也十分準確,叫《約翰·科扎製造出一台發明機器:這一發明贏得了多項專利,勝過了人類並且很快將飛向宇宙》。憑借探索「所有選項」的能力和數學資源,科扎的基因算法設計出多個電路圖,還對很多人類發明的專利進行了逆向工程,並找到了很多應用方式,這些方式與原有專利有本質的不同,從而避免了專利重疊。

當然,人類智能有自己獨特的優勢。雖然受能量和物理空間的限制,人類的大腦相對較小,但正是這一點帶來了許多進化上的「智慧」。人類智能擁有一套非常有效的刪減技巧,能避免大腦依次處理幾十億種情況,只為找到一兩種有用的信息,從而防止大腦承受過重的負擔。那種類似於暴力破解的方法所需的運算量是生物體無法承受的,但可以肯定的是,接近無限的數學能力加上足夠的計算速度,的確可以帶來新發現,而我們的大腦目前還沒有得出此類發現。由於我們必須節省能量,而且考慮到大腦所受的物理限制,我們必須以最優化的方式利用大腦,因此我們在某種程度上可以說是「思維僵化」。然而機器可以使用大量的能量和空間,因此它們的智能與我們的智能有本質上的區別。

不僅我們的計算能力受到生物學限制,就連我們的記憶力也受到這一限制,我們所能記住的事情有限而且「模糊不清」。在許多心理學或智力測試、遊戲、有趣的挑戰中,測試者會給我們看一張房間的照片,幾秒後,我們被要求回憶窗簾的顏色或者牆上的畫的數量。我們很難記住這些信息,因為記住每個細節對我們的進化生存而言並不是非常重要,但計算機可以記住它接觸到的任何圖片、聲音或事情的每一個細節。人類學習後會忘記某些內容,但計算機不會。對機器來說,「什麼是重要的」這一問題有著截然不同的含義。我們往往更容易記住重要的時刻,但機器會記住每一件事,然後再確定這些保存完好的經歷中哪些部分對未來是重要的。顯而易見,這種具有完整記憶能力的智能,其行為完全不同於我們人類的行為。

大部分人都認為學習是一種智能行為,但人類與機器對學習的定義是不同的。試著考慮一下,我們只能學習被感知到的知識,通過一種感官獲得所學內容,比如視覺、手指的觸覺、嗅覺或味覺等。我們努力擴展這一能力,試圖直接看穿數學、邏輯等抽像工具,為什麼傑出的數學家或物理學家如此少?其中一個原因在於,經驗越抽像,我們就越難處理它們。我們看不見四維、五維或十維空間,所以只有極少數人可以只通過使用數學等工具思考四維或更高維度的空間。我們所有人都能直接看到三維空間,因此在探索這一直接可以被感知到的空間方面做得很好,而機器智能在這方面再一次不同於人類。委婉地說,以數學為基礎構造而成的智能不會被數學應用能力所限制。高維度空間的感知、處理和理解方式與三維空間不同,不僅提供用於長期積累和學習的輸入信息的傳感器類型不受限制,就連此類傳感器或輸入信息的數量也不受限制。如果我們的後腦勺上也長了眼睛,那我們是不是就變成了另外一種生物?機器智能把這種差異拓展到了極致。

可能最基本的一點在於,人類智能來自我們的思維。我們的思維存在於一個地點,被牢牢地固定在身體內。一個身體只能容納一種思維。

機器智能卻可以完全脫離載體。在基礎層面,機器智能不需要考慮保護載體的需求,而在更高層面,機器智能還可以同時在多個地點複製或展示智能。我們無法瞭解在同一時間存在於11個地點是怎樣一種感受,但機器智能可以。

自我改進是人類與機器智能之間的另一個差異。數千年來,人類一直在追求自我改進。我們尊敬學者、老師和指導者,因為他們能夠以多種方式幫助我們學習和提高自我,包括提高我們使用智能的能力。這一改進,即智能的提高,對我們而言是一種緩慢的、間接的過程。我們通過行為、知識的直接感知或輸入來學習,無法簡單地將他人的智能複製給自己。我們有這樣一些俗語,比如「有些知識只能通過經驗學習」等。機器智能不局限於這種自我改進形式,它們可以複製100萬個自己,操控它們、測試結果,然後摒棄不良的更改。這是對智能實施的非常直接而快速的操控,而且它不會讓本體承擔任何成本或後果。如果人類一直局限於我們的生物智能,就不可能實現如此直接而快速的自我改進。

● ○ ●

上述幾點只是機器智能與人類智能之間主要差異的一部分。根據這幾點能更容易地瞭解會思考的機器與人類智能有多大的不同。

雖然我們距離完全有感知的機器還有很長的一段路要走,但近期在人工智能領域所取得的突破為我們指明了方向。這主要歸功於經過改進的新的機器學習技術——深度學習。這一系列精明的技術受到大腦結構的啟發,目前它們被用於支持谷歌的搜索引擎、Facebook(臉譜網)的自動照片貼標、蘋果的Siri、特斯拉的無人駕駛汽車等各種新事物。那麼深度學習到底是什麼?