讀古今文學網 > 人工智能:改變世界,重建未來 > 土耳其機器人的復仇 >

土耳其機器人的復仇

這些工作不僅涉及建造更大更好的人工智能系統,還包括人類要與這種人工智能系統合作的工作。後者有時被稱作土耳其機器人工作,這是以沃爾夫岡·馮·肯佩倫(Wolfgang von Kempelen)在18世紀發明的「土耳其行棋傀儡」(The Turk)命名的。土耳其行棋傀儡遊歷了歐洲,打敗了包括拿破侖·波拿巴和本傑明·富蘭克林在內的眾多象棋手。然而,人們後來發現,土耳其行棋傀儡根本算不上是一個機器,只是一個躲在秘密隔間裡控制「機器人」傀儡的人類象棋師。如今的人工智能工具也是差不多的原理,它們看起來像是擁有機器智能,而實際上只是一種混合智能——每一步都需要人類和機器共同輸入信息。土耳其機器人的工作可以是任何因為機器無法完成而分配給人類的工作。因此,這有時也被稱作「人工的人工智能」(Artificial Artificial Intelligence)。

許多企業都進行了人工的人工智能方面的試驗。最著名的就是亞馬遜的機械特克(MTurk)平台,該平台允許個人和企業進行眾包,完成人工智能無法獨立完成的人類智能任務(HIT)。從在圖片中找到物體並進行標記到轉錄音頻,該任務涉及的範圍十分廣闊。

亞馬遜並不是唯一的參與者。2015年8月,Facebook發佈了一款基於文本的人工智能助理「M」,使用的技術與第四章中描述的類似。與Siri、Google Now和微軟的Cortana不同的是,M同時使用人類和人工智能來回答用戶的問題。如果人工智能沒能給出滿意的答案,人類將繼續完成這一任務。

推特(Twitter)也僱用了大量合同工,他們被稱為判定官,主要工作就是解釋微博上不同檢索詞的意思。舉例來說,2012年10月3日下午6點,美國推特上「大鳥」(Big Bird)一詞的搜索量突然飆升。推特使用其人類判定官確定這個詞指的是正在談論政府對公共廣播進行資助的米特·羅姆尼(Mitt Romney),而不是「芝麻街」。為什麼人類能夠比機器更好地完成這一工作?因為我們比機器更瞭解這些暗喻的含義。

推特工程師在博客中解釋道:「收到判定官的回應後,我們會將信息推送到後台系統,這樣下次有用戶搜索這一信息的時候,我們的機器就能夠使用這一附加信息。」

隨著企業投資開發更大更好的人工智能系統,對這類土耳其機器人工作的需求會不斷增加。例如,據稱2011年亞馬遜的機械特克平台有「來自190個國家的超過500 000名活躍工作者」。如今,這一數據可能變得更高。

土耳其機器人主要被詬病的是工作所得太少。即使是美國的土耳其機器人工作者每小時也只能賺1英鎊左右,而且享受不到勞動保護和相關福利。這是因為人類從事的需要運用智能的任務儘管因其難度而讓機器迷惑不已,但是以人類標準來看普遍是沒有技術含量的,大多數人都能夠熟練地完成這些工作。因此,全球能做這項工作的工人有很多,這就降低了成本。結果就是不止一位批判家曾經稱之為「數碼血汗工廠」。

這當然是對的,而且有些使當前的人工智能系統更加智能的工人根本得不到報酬。正如我們所知,目前許多成功的人工智能應用都依靠人類生成的數百萬甚至數十億數據。不成文的用戶協議是,公司免費提供產品,前提是它們可以利用生成的數據做廣告或使其人工智能系統更加智能。舉例來說,就像我們之前提到的,谷歌的在線翻譯服務看似是百分之百的機器智能,實際上,它是在人類用戶提供的數據基礎上工作的,它使用的單詞和短語是人類在之前的翻譯中就匹配好並且應用到所有文本中的。下次使用谷歌翻譯的時候,你可以想一下這些土耳其機器人,它們的背後是經驗豐富的人類譯員,他們擅長不同語言,很多人都有博士學位。

與那些自願報名參加土爾其機器人任務的人不同,這些譯員永遠不會收到報酬,也就是除了最初合同規定的工作之外的報酬。漢娜·呂岑(Hanna Lutzen)將《哈利·波特》翻譯成了丹麥語,因此她將收到挪威居倫達爾出版社的稿酬,而之後,如果谷歌使用這些加起來超過100萬字的數據幫助你翻譯一封來自女友的用丹麥語寫的情書,谷歌不會給她一分錢。

這與現實世界中類似「取樣」所涉及的法律問題不同。舉例來說,在嘻哈文化中,音樂家們通常將其他人的作品分割開來再重新使用。如果這樣做,他們必須為使用的部分支付費用。如果沒能支付費用,對方可能提起法律訴訟。2006年法院判決美國嘻哈音樂人聲名狼藉先生(Notorious B.I.G.)的專輯《準備死去》(Ready to Die)停止銷售,因為專輯在沒有獲得適當許可的情況下引用了一首1972年的歌曲《清晨歌唱》(Singing in the Morning)。德國電子樂隊「發電站」(Kraftwerk)在法庭上成功辯解稱其音樂的最小片段(例如幾小節鼓點)都受版權保護。

這與合法使用數據有什麼關係呢?從某種意義上來說,我們每個人都是土耳其機器人,因為正是我們每天生成的數據使人工智能系統變得更加智能。無論是在Facebook上傳照片還是輸入驗證碼,我們都是在訓練那些將接管我們工作的機器人。在不久的將來,我們需要就數據的價值展開一場嚴肅的對話。正如我們常說的,如果說數據是數字經濟的原料,那麼我們應當重視它。

虛擬現實領域的先驅傑倫·拉尼爾(Jaron Lanier)建議了一種方法,那就是使用一個通用的小額付款系統。拉尼爾舉了幾個例子。假設你報名參加了一個網上約會活動,你提供信息進行浪漫匹配,而公司會使用你的信息來完善其算法,進而吸引其他用戶。Facebook可能會將你的照片放到廣告裡並將頁面定向發送給你的朋友。另外一個例子就是,網飛公司(Netflix)可以使用你的瀏覽偏好來製作一部電視劇,就像在艾美獎上獲獎的美劇《紙牌屋》一樣,這部電視劇就是完全根據網飛公司的用戶數據製作的。在這樣的案例中,可以創建一個公式來確定數據的出處和這些數據對某些特定決策的重要性。這一計算要求公司對用戶進行小額付款,就像有人引用音樂家的作品時需要支付版稅一樣。

這個想法聽起來有些牽強,但是在過去的10年裡,法律確實在追趕技術轉移的步伐。歐盟針對谷歌的「被遺忘權」[2]這樣的判例表明了法律仍在適應數字化新技術。在某種情況下,數據所有權的問題一定會經歷詳細審查。讓我們回到音樂取樣的例子中,早些時候,有很多違法取樣的事件發生。後來,技術成為主流音樂的一部分,藝術家們突然發現自己因版權侵權面臨著數百萬美元的罰款。同樣,人工智能帶來的就業方式轉變使土耳其機器人從事的這樣的工作更加普遍,我們仍需探討驅動人工智能系統的數據到底歸誰所有。如果以正確的方式實施,這不僅能幫助個人,而且能夠幫助企業。在21世紀,企業的實際價值是其持有的可分析數據。如果用戶因提供數據而獲得經濟回報,那麼他們使用產品時就更有動力。如果我們生成的所有數據都使用傑倫·拉尼爾提出的通用小額支付系統,可以想像,土耳其機器人每小時賺的薪水將從1英鎊上漲到英國最低工資標準6.7英鎊,甚至更高。這對創建一個數字框架來說是至關重要的一步,在這個框架中,人工智能系統將變得更加智能,但人類也可以共享創造的財富。