讀古今文學網 > 人工智能的進化 > 投機取巧不可行 >

投機取巧不可行

由於在非正式對話中缺乏控制權,轉而採用更加受控制的設置是很有必要的。這令偽造智能行為變得更加困難。

想像這樣一個心理學實驗:有一些需要回答「是/否」的問題,被試者只能通過按壓按鈕來回答問題,其中綠色按鈕表示「是」,紅色按鈕表示「否」。雖然我們不想對專業知識(法律、醫學、飛機操作、高中物理等)進行測試,但還是想設計一些被試者能夠運用所知內容來回答的問題。為了考驗常識,我們希望能夠將問題置於全新的、陌生的環境中。

例如,思考這樣一個問題:

鱷魚能跑障礙賽嗎?

假設這個問題的被試者知道鱷魚和障礙賽分別是什麼。(障礙賽是一種賽馬形式,與普通的賽馬過程類似,不同點在於馬匹需要在比賽過程中跨越多道跨欄。這就像是馬匹的跨欄比賽。)瞭解了這些,測試對像應該能夠輕鬆地按下正確的紅色按鈕。(在這裡,我們設想「理想」的被試者既能力突出,又積極性高。)

這個問題有趣的地方在於:儘管關於鱷魚和障礙賽的言論和文章很多,但是很少有人會將這兩種事物放在一起討論。這也就說明了一個新的情況:回答問題不能通過搜尋套話來得出答案。在此,在線文本無法提供有效的幫助。換句話說,即使我們假設任何人說過、寫過的內容都能在線搜索到,也不一定能找到問題的答案。(這樣說也不對。我以前舉過這個例子,因此可以在網上搜到我寫的關於鱷魚和障礙賽的文章。但這並沒有說服力。)

再看另一個例子:

是否允許一支棒球隊在帽子上粘上小翅膀?

除了我以外,再沒有人說過或寫過任何關於這個話題的內容,也查不到關於這個話題的有效信息,但一個懂棒球的人應該知道這個問題的答案。(在這種情況下,除非被試者擔心這個問題有什麼陷阱,否則答案是非常明顯的。不過,這個問題當然沒有陷阱。)

上述這個顯而易見的問題也叫長尾現象。在第7章中,我們會詳細分析長尾現象。長尾現象的理念大概是這樣的:儘管大多數在線搜索引擎的搜索重點都是一些常見的主題(如娛樂、體育、政治、貓咪視頻等),但還有很大一部分內容與這些主題聯繫甚微,即呈長尾分佈。這部分包含的話題就非常罕見了。

雖然一般情況下,我們能夠很容易地搜索到相關的文本信息,但是面對一些罕見的問題,比如上文中提到的鱷魚問題以及在棒球帽上粘上小翅膀的問題,我們是無法通過網絡文本搜索得到直接的答案的。

但是,人們還是能夠正確地回答這些問題。

所以這能說,我們發現了一種需要利用知識的智能行為嗎?不,這還不夠嚴謹。儘管被試者無法搜索到問題的答案,但它們也有可能通過其他方式回答出問題。

鱷魚問題的考查意圖很明確。它要求被試者思考之後再回答:鱷魚的腿很短;障礙賽的跨欄很高,鱷魚跳不過去;因此,一條鱷魚跑不了障礙賽。

但還有其他的回答方式,不需要你深入地理解這個問題。一種是使用所謂的封閉世界假設(closed-world assumption, CWA)。該假設如下所述:

如果沒有證據證明某物的存在,我們可以認為其不存在。

我們就是用這種方式來回答「世界上有沒有身高超過7尺的女性領導人」的,這個問題的答案不是被別人告知「沒有」,而是我們自身認為「沒有」。因為如果有這樣一位女性領導人,我們肯定會聽說過。對於上面提到的鱷魚問題,被試者可能會說:「既然我從沒聽說過(例如,我搜不到任何與該問題相關的文本信息)能跑障礙賽的鱷魚,那答案肯定是『不能』。」故事就此結束。

請注意,在這裡有一個小技巧:正是由於對問題的疑問,我們才得出了問題的答案。但如果將故事中的鱷魚換成瞪羚,這樣的思路就會得出錯誤的答案。不管怎麼說,如果我們只關心如何正確地回答鱷魚問題,這樣的小技巧就足夠了。

那麼,我們是否能夠改良心理測試,消除這樣投機取巧的行為呢?

很遺憾,對於這個問題,我們很難回答。我們能做的就是更加謹慎地設置問題,並深入研究被試者會如何應答。其他人已經提出了一些可行性方法,我們在這裡回顧一下厄尼·戴維斯(Ernie Davis)、勞拉·莫根斯特恩(Leora Morgenstern)和我提出的方法。