人工智能的進化：投機取巧不可行_赫克托·萊韋斯克

由於在非正式對話中缺乏控制權，轉而採用更加受控制的設置是很有必要的。這令偽造智能行為變得更加困難。

想像這樣一個心理學實驗：有一些需要回答「是/否」的問題，被試者只能通過按壓按鈕來回答問題，其中綠色按鈕表示「是」，紅色按鈕表示「否」。雖然我們不想對專業知識（法律、醫學、飛機操作、高中物理等）進行測試，但還是想設計一些被試者能夠運用所知內容來回答的問題。為了考驗常識，我們希望能夠將問題置於全新的、陌生的環境中。

例如，思考這樣一個問題：

鱷魚能跑障礙賽嗎？

假設這個問題的被試者知道鱷魚和障礙賽分別是什麼。（障礙賽是一種賽馬形式，與普通的賽馬過程類似，不同點在於馬匹需要在比賽過程中跨越多道跨欄。這就像是馬匹的跨欄比賽。）瞭解了這些，測試對像應該能夠輕鬆地按下正確的紅色按鈕。（在這裡，我們設想「理想」的被試者既能力突出，又積極性高。）

這個問題有趣的地方在於：儘管關於鱷魚和障礙賽的言論和文章很多，但是很少有人會將這兩種事物放在一起討論。這也就說明了一個新的情況：回答問題不能通過搜尋套話來得出答案。在此，在線文本無法提供有效的幫助。換句話說，即使我們假設任何人說過、寫過的內容都能在線搜索到，也不一定能找到問題的答案。（這樣說也不對。我以前舉過這個例子，因此可以在網上搜到我寫的關於鱷魚和障礙賽的文章。但這並沒有說服力。）

再看另一個例子：

是否允許一支棒球隊在帽子上粘上小翅膀？

除了我以外，再沒有人說過或寫過任何關於這個話題的內容，也查不到關於這個話題的有效信息，但一個懂棒球的人應該知道這個問題的答案。（在這種情況下，除非被試者擔心這個問題有什麼陷阱，否則答案是非常明顯的。不過，這個問題當然沒有陷阱。）

上述這個顯而易見的問題也叫長尾現象。在第7章中，我們會詳細分析長尾現象。長尾現象的理念大概是這樣的：儘管大多數在線搜索引擎的搜索重點都是一些常見的主題（如娛樂、體育、政治、貓咪視頻等），但還有很大一部分內容與這些主題聯繫甚微，即呈長尾分佈。這部分包含的話題就非常罕見了。

雖然一般情況下，我們能夠很容易地搜索到相關的文本信息，但是面對一些罕見的問題，比如上文中提到的鱷魚問題以及在棒球帽上粘上小翅膀的問題，我們是無法通過網絡文本搜索得到直接的答案的。

但是，人們還是能夠正確地回答這些問題。

所以這能說，我們發現了一種需要利用知識的智能行為嗎？不，這還不夠嚴謹。儘管被試者無法搜索到問題的答案，但它們也有可能通過其他方式回答出問題。

鱷魚問題的考查意圖很明確。它要求被試者思考之後再回答：鱷魚的腿很短；障礙賽的跨欄很高，鱷魚跳不過去；因此，一條鱷魚跑不了障礙賽。

但還有其他的回答方式，不需要你深入地理解這個問題。一種是使用所謂的封閉世界假設（closed-world assumption, CWA）。該假設如下所述：

如果沒有證據證明某物的存在，我們可以認為其不存在。

我們就是用這種方式來回答「世界上有沒有身高超過7尺的女性領導人」的，這個問題的答案不是被別人告知「沒有」，而是我們自身認為「沒有」。因為如果有這樣一位女性領導人，我們肯定會聽說過。對於上面提到的鱷魚問題，被試者可能會說：「既然我從沒聽說過（例如，我搜不到任何與該問題相關的文本信息）能跑障礙賽的鱷魚，那答案肯定是『不能』。」故事就此結束。

請注意，在這裡有一個小技巧：正是由於對問題的疑問，我們才得出了問題的答案。但如果將故事中的鱷魚換成瞪羚，這樣的思路就會得出錯誤的答案。不管怎麼說，如果我們只關心如何正確地回答鱷魚問題，這樣的小技巧就足夠了。

那麼，我們是否能夠改良心理測試，消除這樣投機取巧的行為呢？

很遺憾，對於這個問題，我們很難回答。我們能做的就是更加謹慎地設置問題，並深入研究被試者會如何應答。其他人已經提出了一些可行性方法，我們在這裡回顧一下厄尼·戴維斯（Ernie Davis）、勞拉·莫根斯特恩（Leora Morgenstern）和我提出的方法。