讀古今文學網 > 人工智能的進化 > 威諾格拉德模式 >

威諾格拉德模式

像前文一樣,我們設想一個需要被試者回答問題的心理實驗,按鈕的設置同前文一樣,問題的答案只有兩種。問題的格式保持不變,舉例如下:

瓊一定要對蘇珊提供的幫助表示感謝。(Joan made sure to thank Susan for all the help she had given.)

誰提供了幫助?

‧ 瓊

‧ 蘇珊

我們將這種問題稱為威諾格拉德模式問題(Winograd Schema questions),其特徵如下:

第一,問題中涉及兩方(兩方均同為男、女、對像或團體)。在上面的例子中,兩方就是瓊和蘇珊。

第二,代詞指兩方中的一方(「他」、「她」、「它」或「他們」)。在上面的例子中,代詞指「她」(she)。

第三,問題都是一樣的:代詞指的是什麼?對於上面的情況,問題就是:提供幫助的「她」指的是誰?

第四,在問題背後,模式中有兩個特殊的單詞。模式中有一個位置能夠用其他的單詞進行替換。問題的正確答案取決於所選擇的替代詞。在上文中,使用的特殊詞語是「提供」,另一個是「收到」(雖然該詞沒有出現)。

所以,每個威諾格拉德模式都可以衍生出兩個相似的問題:

瓊一定要對蘇珊提供的幫助表示感謝。(Joan made sure to thank Susan for all the help she had given.)

誰提供的幫助?

‧ 瓊

‧ 蘇珊 √

以及

瓊一定要為她得到的幫助而感謝蘇珊。(Joan made sure to thank Susan for all the help she had received.)

誰得到了幫助?

‧ 瓊 √

‧蘇珊

這兩個問題的英文版本僅僅有一個單詞的差異,但只是這個小差異就能夠防止投機取巧的行為出現。

為了更好地瞭解測試的內容,以下列舉了一些其他的示例。第一個問題適合年幼的孩子回答:

獎盃無法裝進棕色手提箱裡,因為它太小了。這裡的「它」指的是什麼?(The trophy would not fit in the brown suitcase because it was too small. What was too small?)

‧ 獎盃

‧ 棕色手提箱

在這種情況下,所使用的特殊單詞一個是「小」,另一個是「大」(雖然該詞沒有出現)。

以下是模式創始人特裡·威諾格拉德(Terry Winograd)提出的原始示例:

鎮議會議員拒絕給憤怒的示威者許可證,因為他們害怕暴力。(The town councilors refused to give the angry demonstrators a permit because they feared violence.)

誰害怕暴力?

‧ 鎮議會議員

‧ 憤怒的示威者

這裡使用的特殊單詞是「害怕」,替代詞是「支持」。

值得注意的是,威諾格拉德模式中有許多需要專業知識才能回答的問題。以下這個例子與某些特定材料有關:

大球從桌子上墜落,因為它是由泡沫聚苯乙烯塑料製成的。(The large ball crashed right through the table because it was made of styrofoam.)

什麼是由泡沫聚苯乙烯塑料製成的?

‧ 大球

‧ 桌子

這裡使用的特殊單詞是「泡沫聚苯乙烯塑料」,替代詞是「鋼」。

以下示例可用於測試解決問題的能力:

一袋土豆被壓在一袋麵粉下面,所以要先搬走它。(The sack of potatoes had been placed below the bag of flour,so it had to be moved first.)

要先搬走什麼?

‧ 一袋土豆

‧ 一袋麵粉

這裡使用的特殊單詞是「下面」,替代詞是「上面」。

以下示例可用於測試可視化能力或想像力:

薩姆畫了一幅牧羊人與羊的畫,總體看還算可以,但他們看起來更像是高爾夫球手。(Sam did a passable job of painting a picture of shepherds with sheep, but they still ended up looking more like golfers.)

什麼看起來像高爾夫球手?

‧ 牧羊人

‧ 羊

這裡使用的特殊單詞是「高爾夫球手」,替代詞是「狗」。

出現在威諾格拉德模式中的語句都是經過深思熟慮後設置的,雖然有些是與實際生活相關的實例,但它們也都是有目的性的。讓我們來看一下喜劇電影《飛機》(1980年)中的一段對話:

伊萊恩:今天早上,你收到了總部寄來的一封信。

特德:它是什麼?

伊萊恩:它是一個大型建築,是領導人開會的地方,但這不是重點。

注意,對話中出現了兩個名詞「信」和「總部」,代詞「它」,以及由於指代內容出錯而引起的笑話。

當然,並不是表面上格式相同的問題就會有同樣的回答方法。我們還會設置一些「超級容易」的問題,示例如下:

賽車輕鬆地超過了校車,因為它速度太快。(The racecar easily passed the school bus because it was going so fast.)

誰的速度太快?

‧ 賽車

‧ 校車(特殊詞=快;替代詞=慢)

問題在於,可以使用如下技巧來回答這個問題:完全忽略第一句話,檢測在線文本中哪兩個詞一起出現的頻率更高(根據谷歌搜索):「賽車」與「快」或「校車」與「快」。與之類似的示例還有:

女士們不再服用這些避孕藥,因為它們是致癌的。(The women stopped taking the pills because they were carcinogenic.)

什麼是致癌的?

‧ 婦女

‧ 避孕藥(特殊詞=致癌;替代詞=懷孕)

問題也可能變得「極其困難」,就像這樣:

當比爾說他是比賽的冠軍時,弗蘭克感到很嫉妒。(Frank was jealous when Bill said that he was the winner of the competition.)

誰是冠軍?

‧ 弗蘭克

‧ 比爾(特殊詞=嫉妒;替代詞=快樂)

問題在於,「快樂」一詞會使問題變得模糊。弗蘭克既可能因為自己是冠軍而感到快樂,也可能因為比爾是冠軍而感到快樂。(當然,我們會糾正這些極端案例,但我們在此先不用考慮。)

威諾格拉德模式問題不一定適合每個被試者。例如,上文中提到的「獎盃/手提箱」示例可能適合兒童,但「鎮議會議員/示威者」的問題卻不適合兒童。「泡沫聚苯乙烯塑料/鋼」的問題不適合那些不瞭解泡沫塑料的人。一般來說,威諾格拉德模式問題要經過仔細審查之後才能投入使用。至少,我們需要確保被試者知道題目中出現的所有單詞的含義。

考慮到這些問題,現在就可以制訂圖靈測試的替代方案了。首先在程序庫中輸入一組威諾格拉德測試題。這組威諾格拉德測試題中包含一些前文所示的問題,隨機選擇兩個特殊的詞語,選擇錯誤會有懲罰。該測試可以自動運行,不需要專家評審。

總結一下:關於圖靈測試,我們贊同圖靈的觀點:當與智能(或思想、理解)有關時,實質性問題在於計算機程序能否完成一個可觀察的行為。然而,圖靈倡導的自由形式的對話並不是正式測試的最佳手段。因為這種形式將主題隱藏在玩笑話當中,裡面充滿了表達技巧和煙幕彈。我們的立場是:基於威諾格拉德模式問題的替代性測試不能被濫用,儘管有些連正常對話所需的智能水平都難以達到。(例如,我們在第1章有關圖靈測試的討論中看到的關於十四行詩的內容。)