讀古今文學網 > 萬萬沒想到:用理工科思維理解世界 > 第四十五章 我們能從機器人世界盃學到什麼 >

第四十五章 我們能從機器人世界盃學到什麼

(《新知客》,2010年6月)

「如果你不知道往哪踢,就往門裡踢」,多年以前施拉普納曾經這樣教中國隊。也許這只是德國人調侃,但很多球隊即將懷著這樣簡明易懂的戰術參加本屆世界盃賽 — 好在他們不是去南非,而是去新加坡參加另一場世界盃足球賽:機器人的世界盃。這項由日本發起的賽事規模越來越大,它的目標是在2050年,讓一支機器人足球隊戰勝人類世界盃冠軍。人類球員對此不必過分擔心,從目前的發展水平來看,我們距離把足球比賽外包給機器人的那一天還非常遙遠。

即使是這樣,我們仍然能從機器人比賽中學到非常有價值的東西,這個價值不是關於機器,而是關於我們。通過考察機器人球員的弱點,我們可以瞭解人的優勢到底是什麼。更進一步,我們可以瞭解人到底是怎麼學會各種技能的。

最引人矚目的比賽是類人組。這是目前最先進的機器人球員,他們身高相當於一兩歲到四五歲的小孩,本屆世界盃甚至首次有了成人身高組。他們直立行走,用腳來踢球,而不像小型組球員那樣被裝在輪子上。除了發現球,追上球和射門這些基本功能之外,如果機器人在比賽中跌倒,還必須能以一個變形金剛式的動作自行站立起來。看他們做這些動作的時候你會幾乎覺得他們是活的。然而面對近在咫尺的球門線上一個幾乎不會動的守門員,球就在停腳下,在沒有干擾的情況下,一個機器人球員需要30秒的時間來調整自己跟球的相對位置,然後才能完成一個很輕的射門動作。這已經足夠成為一個必進球,因為距離太短,球速太「快」,守門員來不及做出任何反應。比賽不但談不上技戰術,甚至談不上拼搶,大多數情況下能踢到球就很不錯了。

相對於機器人研究的現狀而言,能踢到球已經是一個相當了不起的成就。據悉尼技術大學的Williams教授介紹,作為機器人,你要在各種狀態之間切換。如果你處於無球狀態,程序給你的任務是「找到球」,而在球場上的眾多物體中判斷哪個是球已經是很難的技術。發現球以後你的狀態變成「走向球」,你要計算球的方位,調整自己的姿態來面向球,然後才能邁步走過去,這還不算球可能在移動。一旦球在你腳下了,你的狀態將變成「拿球」,然後你不必考慮什麼複雜的傳切配合,只需聽從施拉普納的簡單忠告,射門。不過在此之前你還必須完成一個複雜的任務,那就是首先找到球門,然後計算射門角度並尋找一個合適的你跟球和球門的相對位置。

問題在於,人踢球的時候並不做任何數值計算。MIT的計算機科學家Rodney Brooks最近指出, 要想讓機器人擁有人的基本智能,它至少需要2歲兒童的物品認知能力,4歲兒童語言能力,6歲兒童的動手能力,和8歲兒童的社交認知能力,而目前的技術水平據此相距甚遠。實際上,當前機器人科學家正在研究的問題,是如何讓機器人學會怎麼區分不同的物體,怎麼伸手去把一個物體拿起來,而這些都是人類在一歲以前就掌握的技能。小孩伸手拿東西的時候既不計算出手角度也不用考慮手指組合的姿態,他們幾乎是無意識的就能把各種複雜的物體,使用每次都不太一樣的姿勢抓取過來。我們都會做,可是我們都不知道我們怎麼做的。

絕大多數計算機程序,比如傳統的專家系統,本質上都是融合了海量知識的一系列 「if… then…」邏輯判斷,而這樣的系統無法適應真實世界的千變萬化,不能算真正的「智能」。在人工智能領域的最前沿,科學家必須一邊研究計算機,一邊研究人腦。現在美國國家科學基金的 Project One 項目中,來自多個大學的計算機科學家,認知科學家和發展心理學家正在團隊合作,目標是創造一個具備一歲嬰兒的認知和交流能力的機器人。他們邀請嬰幼兒到最尖端的計算機實驗室來跟媽媽玩躲貓貓之類的遊戲,使用高速攝像機記錄每一個動作和反應。在這個項目中,發展心理學家 Lev Vygotsky 發現了嬰兒在一歲左右的一個智力躍進:當一個嬰兒想要一個玩具而夠不著的時候,他會示意媽媽把這個玩具遞給他!Project One 正在努力研發世界上第一個具備這種能力 — 不是人指導機器人,而是機器人反過來指導人 — 的機器人。

科學家們發現與其說他們現在更加瞭解怎麼造一個機器人,不如說他們現在更加瞭解人類自己。當前的一個共識是小孩出生的時候大腦裡並沒有預存任何關於怎麼拿一個物體之類的程序,家長也沒給輸入,是孩子自己在實踐中的不斷摸索,試錯和練習使他們掌握了這些技能。我們不是通過閱讀說明書學會的開車,我們通過上路練習,被人鳴笛抗議,被教練和交警訓斥學會開車。人的學習過程不是對動作要領的記憶,而是通過反覆練習使得控制身體的各個腦神經元之間不斷地連接,以至於從硬件層面對大腦重組。

人工智能研究的趨勢就是讓機器像人一樣具有學習能力,使用軟件模擬人的神經網絡。機器人球員不再是一出廠就會,他們也需要大量的訓練和比賽。比如當機器人做對了一個動作,就給他一個正面的激勵,做錯了給一個懲罰。通過神經網絡的訓練,機器人已經學會了從眾多物體中識別一個人臉之類的技能。

人的這種學習和判斷過程往往是無意識的。暢銷書《異類》的作者格拉德威爾的另一本書,Blink(《決斷兩秒間》)中,就記載了大量的無意識判斷的神奇例子。比如一個網球教練每次看電視轉播都能預知運動員的發球失誤,可是他無法解釋自己是根據什麼做出的判斷。格拉德威爾說不清這個能力來自哪裡,歸結為人具備的一個超級計算機系統。清華大學趙南元教授在《認知科學揭秘》一書中指出,這套系統來自進化,人工智能研究必須考慮人是進化的產物這個事實。Jonah Lehrer 的 How We Decide 一書也提到,人腦的確有兩套計算系統:一套是有意識的用於數值和邏輯計算,這套系統在人類歷史中出現較晚,所以速度很慢;而另一套系統,靠神經元的連接重組形成的感情系統,則是數十萬年進化的產物,其速度要快得多。

所以人的優勢在於「感覺」,在於對「感覺」的訓練。美式足球聯盟曾經認為球員應該像計算機一樣打球。鑒於四分衛的重要性,他們給四分衛候選新秀進行很高難度的智商和數學測驗,內容是12分鐘內50道越來越難的數學題,認為四分衛在最短的時間內判斷場上形勢需要用到這些能力。然而事實證明很多最好的四分衛在這種考試中得分很差,他們不是用數學比賽。如果你採訪一個四分衛是怎麼在關鍵時刻傳出絕妙一球的,他的回答很可能是「我不知道。傳球並沒有一定之規,我只是感覺應該把球傳向那裡。」

人類中的大師都這樣。在機器人學會說「我只是感覺」之前,他們不可能戰勝人類冠軍。