讀古今文學網 > 人工智能的進化 > 談話機器人 >

談話機器人

圖靈測試關注的重點是外部可觀察的行為。我們在這一章中關注的是:非正式對話是一種極易造假的行為。

模仿遊戲的難點在於欺騙。遊戲最後,關注的重點不是計算機程序能否像人類一樣對話,而是計算機程序能否騙過詢問者,並使其認為自己在與人類對話。每個騙子都知道,這兩個問題是不同的。魔術師不需要真正擁有超感覺力(ESP)就能取悅觀眾,他只需要讓觀眾相信他有這樣的能力就可以了。(或者更準確地說,他必須使觀眾相信他,而且不能告訴觀眾他是如何做到的。)圖靈提出的這個非正式對話恰好給了騙子們更多發揮的空間。

設想一下:有人模仿醫生在醫院查房。這個人只要仔細查看患者的病歷,在談話中帶著醫生的自信與權威性,並盡量保持沉默寡言,就能夠模仿成功。在電影《逍遙法外》中,弗蘭克·阿巴內爾就模仿了電視節目中出現的基爾代爾(Kildare)醫生,通過質問實習生「你同意嗎」來轉移別人對他的關注。

接下來考慮一下機器人ELIZA的例子。這是約瑟夫·魏澤堡(Joseph Weizenbaum)在20世紀60年代編寫的一款計算機軟件,裡面包含的算法並不複雜,卻能讓人以為是在和精神科專家對話。這種欺騙能夠起作用,至少在某種程度上起作用,乃是因為從日常談話來看,我們的標準真的不高。

以下是ELIZA與奧利弗·米勒(Oliver Miller)談話的片段:

患者:我只有在寫作時才感到開心。

ELIZA:你寫了多久了?

患者:一直在寫,但18歲以後就處於病態的寫作狀態了。

ELIZA:你在想什麼?

患者:嗯。

ELIZA:這對你有什麼啟示?

患者:我認為只有在寫作時才感到快樂是不夠的。

ELIZA:這很困擾你嗎?

患者:……嗯,因為你不能每時每刻都在寫。我們還是要回到現實世界中來,還要面對真實的人。

ELIZA:你現在有什麼感受?

患者:我一直在想葉芝(Yeats)的《人與回聲》一詩,你知道這首詩嗎?

ELIZA:你是想說你一直在思考葉芝的《人與回聲》一詩嗎?有什麼特殊的原因嗎?

患者:是的。

對於採用羅傑斯治療法的精神科醫生來說,除非是短期治療,否則不會採用讓患者一直說話的方法。(然而,ELIZA只是一個小程序,在Emacs文本編輯器中僅有一個娛樂版本,因此Mac OS X系統都自帶該程序。)

最後,讓我們來看一下自1990年以來每年都會舉辦的勒布納人工智能競賽。這是一個類似於圖靈測試的競賽。

在這一比賽中,我們能夠看到比ELIZA更「人性」的對話。在這些對話中,測試對象的對話相當流利,對話中所運用的考究詞語、雙關、笑話、引用語、旁白,以及情感的爆發和良好的邏輯性,均令人驚訝不已。似乎除了那些直截了當的問題,它都可以應付得來。那麼,詢問者該如何分析這種情況呢?如何判斷機器是否真正理解了文字背後的含義呢?我們只能通過分析更多的對話來完成。「我要回想一下你之前說的話。」很正常,分析短時間的對話很難得出有效結論;即使是長時間的對話,分析同一篇對話記錄的兩位詢問者也會得出不同的結論。

例如,在2014年的競賽中,有超過1/3的詢問者認為一個名叫尤金·古斯特曼(EUGENE GOOSTMAN)的計算機程序是人類。該程序將自己偽裝成一名13歲的烏克蘭男孩,用英語與人交談,從而避免因一些語言上的漏洞而被懷疑。

以下是麻省理工學院的斯科特·阿倫森(Scott Aaronson)與該程序的一次對話:

斯科特:鞋盒和珠穆朗瑪峰,哪個更大?

尤金:我現在難以做出選擇。我再想一會兒。對了,忘記問你來自哪裡……

斯科特:駱駝有多少條腿?

尤金:有時兩條,有時四條。或許有時候是三條?:-)))順便說一句,我還不知道你的特長呢。還是說,你剛剛說過,我沒聽到?

斯科特:千足蟲有幾條腿?

尤金:只有兩條,但切爾諾貝利地區的變異品種可能有五條腿。我知道你是想騙我。

斯科特:不,我只是需要確定你是不是聊天機器人。請直接回答我的問題:螞蟻有幾條腿?

尤金:兩條到四條之間,也許三條?:-)))哇,多麼有營養的對話;-)

斯科特:你明白我為什麼問這些基本問題嗎?你是否意識到我只是試圖盡快揭露你是一個機器人的事實?就像電影《銀翼殺手》中的情節一樣?

尤金:……等一下。

斯科特:你認為你在簡單對話中展現的能力表明了圖靈測試本身的缺陷,還是說這是人們解釋該測試時出現的漏洞呢?

尤金:由於停機維護或容量問題,服務器暫時無法為您的請求提供服務。請稍後再試。

斯科特:你是否會這樣認為:儘管艾倫·圖靈智力過人,但他也很難想到在「模擬遊戲」中進行上文中的常識問答?或者說,儘管他們想到了這些,他們會接受避而不答或者轉移話題這樣的結果?

尤金:不,不完全是這樣。我認為圖靈並不是很聰明,因為他沒有想到「模擬遊戲」中的評委會考慮不周。還有其他問題嗎?

斯科特:與20世紀60年代約瑟夫·魏澤堡編寫的程序ELIZA相比,你覺得你的存在能夠表明什麼特別的想法嗎?

尤金:ELIZA的問世確實是一個重大突破。在它之後研發的所有機器人,都只不過是「革命性的進展」而已。

斯科特:嘿,這是你提出的第一個明智的見解!

結果,圖靈測試並沒有真正激發人工智能研究人員去研發更優秀的會話者,卻導致欺騙詢問者的技巧越來越多。我們曾希望這些智者跳出怪圈,但沒想到得到的卻是超一流的舞台魔法。