讀古今文學網 > 人工智能:改變世界,重建未來 > 親愛的沃森 >

親愛的沃森

觀看肯·詹寧斯在《危險邊緣》中精彩表現的人中,有一個叫查爾斯·力克(Charles Lickel)的,是IBM研究院的高級經理。怎麼說他都算不上是《危險邊緣》的忠實觀眾,但這個節目在2004年的夏天確實給人留下了深刻的印象。一天晚上,力克和他的團隊在一家牛排餐廳吃晚餐。7點鐘的時候,力克驚奇地發現餐廳空無一人,所有客人都放下了手中的牛排,聚集到餐廳吧檯觀看《危險邊緣》。

和IBM的許多人一樣,自從1997年象棋機器人「深藍」(Deep Blue)打敗世界冠軍加裡·卡斯帕羅夫(Garry Kasparov)以後,力克一直試圖在人工智能領域實現新的突破。他覺得自己將在《危險邊緣》中找到答案。《危險邊緣》當然也有缺點,比如缺少科學嚴謹性使其很難吸引IBM的一些員工。他們認為《危險邊緣》就是一個娛樂節目,而非衡量智力的嚴謹方法。但是,這些反對者的意見遭到了否定。

對於那些相信計算機也可以參加《危險邊緣》的IBM員工來說,這一任務正因其不精確性才更加精彩。與有著嚴格的規則和限制的象棋不同,《危險邊緣》的可預測性不強。問題五花八門,但通常依賴於複雜的文字遊戲。選手必須在給定的線索下提供正確的「問題」,一個常見的例子就是:「作為一個形容詞,它的意思是『及時的』;在劇院中,它的意思是給演員提詞。」正確的回答是:「『prompt』這個詞是什麼意思?」為了給出答案,IBM的計算機首先必須將複雜的線索解碼,這些線索常常涉及雙關語。對計算機來說,雙關語十分具有挑戰性,因為它體現了語言的不確定性:實際上,我們經常將同一個詞用在不同的場合,以表達不同的意思。對人類來說,這意味著我們並不需要一個有著數十億不同字詞的語言。對計算機來說,這意味著建立一個智力競賽節目版的搜索引擎並不能解決問題。一個普通的搜索引擎能夠根據關鍵詞搜索統計學意義上的可能答案,回答《危險邊緣》中30%的問題,但它對於剩下的70%問題就無能為力了。IBM的計算機需要更進一步。

參加《危險邊緣》的計算機回答問題時所使用的原始數據有近兩億頁,這些數據都是從各種各樣的資源中提取出來的。這些數據必須本地存儲,因為IBM的機器在「大挑戰」期間無法訪問互聯網。為了進一步探討並發現問題的正確答案,IBM使用了一個名為DeepQA的龐大的並行軟件架構(一種高性能的計算,其中大量的計算會同時進行)。DeepQA能夠使用自然語言處理技術找出《危險邊緣》每條線索中包含的結構化信息。瞭解問題要問的是什麼以後,DeepQA接下來會列出可能的答案,並根據信息類型、可靠性、答案正確的概率以及計算機本身學習到的經驗為每個答案分配不同的權重。計算機會對這些可能的答案進行排序,排名第一的將成為計算機的正式答覆。

該項目的發展逐漸加快。IBM內部將其稱為「Blue J」,之後又以IBM第一位首席執行官托馬斯·沃森(Thomas Watson)的姓氏命名,將名字改為「沃森」。它越來越擅長答題。在2006年的初次測試中,沃森從之前的《危險邊緣》中得到500條線索,而它的正確率只有15%。到2010年2月,該系統已經被充分改進,經常能夠打敗人類選手。

2011年2月,沃森在一個系列電視特別節目中與肯·詹寧斯和《危險邊緣》的另一位冠軍布拉德·魯特(Brad Rutter)對決。詹寧斯十分興奮,當年「深藍」打敗加裡·卡斯帕羅夫的時候他還在上大學,在他看來,終於有機會在人工智能的重要時刻當一把「卡斯帕羅夫」了,他十分確定自己能贏。「我上過人工智能的課,知道能夠在《危險邊緣》中打敗人類的技術要幾十年後才能出現。」他說,「至少我當時是這樣認為的。」

在那場比賽中,「沃森」擊敗了詹寧斯和魯特,贏得了100萬美元的獎金。儘管人類選手的表現十分精彩,但誰才是比賽節目的真正贏家已毫無疑問。詹寧斯被深深震撼了。他承認:「輸得那麼慘真是令人吃驚。」

比賽結束時,戰敗的詹寧斯在答題板上胡亂寫了一個短語,並將其面向攝像機。那是動畫情景喜劇《辛普森一家》中的一句台詞,但用在當時簡直再恰當不過。

那就是:「歡迎新的機器人統治者。」