讀古今文學網 > 人工智能:改變世界,重建未來 > 第二章 以自主學習的方式創建新的人工智能 >

第二章 以自主學習的方式創建新的人工智能

2014年,在谷歌旗下一家名為「DeepMind」的人工智能公司的辦公室裡,一台計算機通過玩一款名為《打磚塊》(Breakout)的老雅達利(Atari)2600電子遊戲消磨時間。該款遊戲是兩個年輕人在20世紀70年代初設計的,他們就是蘋果公司的創始人史蒂夫·喬布斯和史蒂夫·沃茲尼亞克。《打磚塊》實際上是乒乓球遊戲《乒乓》(Pong)的一個變體。不同之處在於,不是在屏幕上將球揮向另一位玩家,而是對著磚牆擊球,將磚塊擊碎。這款遊戲的目標是摧毀所有磚塊。

正如我們在上一章中提到的,人工智能玩電子遊戲並沒有什麼稀奇的。艾倫·圖靈早在1947年就開發出了首款象棋程序,儘管當時的計算機不能運行這一程序。如今電子遊戲的特點是有大量非玩家控制角色,這一編程將簡單的規則結合起來產生複雜的行為。這樣看來,DeepMind的人工智能玩遊戲又有什麼特別的呢?

針對這個問題的回答有兩個。一是DeepMind的人工智能會逐漸變得更加成熟。就像見證孩子逐漸長大一樣,如果一直盯著計算機看,很難察覺到它的變化。然而,每隔50多次遊戲再看一下,效果是十分驚人的。開始的時候,DeepMind的人工智能在《打磚塊》遊戲中的表現簡直糟透了,最簡單的擊球都做不好,而且它似乎並不清楚狀況,就好像是把PS4(索尼第四代遊戲主機)手柄交到90歲的老奶奶手裡,並希望她立刻知道應該做什麼一樣。雖然它也會偶爾得分,但即使最樂觀的旁觀者也只能稱之為運氣。

200次遊戲後,一切變得大為不同。現在遊戲中的球拍能夠在屏幕上左右移動:即使不是持續得分,也可謂能夠輕鬆得分。再經過數百次遊戲,遊戲中的人工智簡直如同《星球大戰4:新希望》結束時的天行者盧克(Luke Skywalker)或《黑客帝國》中的尼奧(Neo)一樣,懶散地擊球,毫不費力。所有無關的動作都消失了,而且它產生了清晰的策略。

令DeepMind的人工智能具有重要意義的另一個原因是,它不需要進行大規模訓練。傳統人工智能的核心原則是必須將規則預先載入系統,這就像是老師在學生參加考試前會依次教他們問題的答案一樣。DeepMind的人工智能與眾不同之處在於,它能夠自主學習,甚至無須告訴它應該怎樣做。它所需要接入的就是構成《打磚塊》遊戲每一幀的30 000個像素點和屏幕上的選手得分。其他需要做的事,就是給它輸入得分最大化的指令。之後,人工智能就可以隨著遊戲的進展獲得遊戲「規則」,然後逐漸形成能夠改善其表現的策略。

DeepMind的人工智能可以玩的遊戲並不只有《打磚塊》。它最早玩的遊戲是《太空入侵者》(Space Invaders),在掌握極少信息的情況下還學會了其他48個遊戲,包括拳擊模擬器、武術遊戲甚至是3D(三維)賽車遊戲。然而,要想突破電子遊戲的「微型世界」還有很長的路要走。但這仍是一項驚人的成就,為人工智能的下一步發展指明了方向。下一步發展是什麼?按照DeepMind的宗旨,下一步就是「解決人工智能」。