讀古今文學網 > 語言本能:探索人類語言進化的奧秘 > 形形色色的構詞法和不計其數的單詞 >

形形色色的構詞法和不計其數的單詞

與此相對的是,心理詞典卻缺少這種光環。它看上去僅僅是一張枯燥乏味的單詞表,必須通過死記硬背才能錄入大腦之中。作家塞繆爾·約翰遜(Samuel Johnson)在自己編纂的《英語詞典》的序言中說道:

從事卑微工作的人注定要接受這樣的命運:他們的努力完全是出於對不幸的恐懼,而並非是為美好前景所吸引。他們備受責難,得不到任何讚揚。他們因為失敗而名譽掃地,因為疏忽而遭受懲罰,而且即便成功也聽不到掌聲,付出也得不到回報。

詞典編纂者就是這些不幸人士中的一員。

約翰遜在詞典中將「詞典編纂者」定義為「一種無害的苦工,整日埋頭於探尋詞源、描述詞義的工作」。然而,我們將在本章中看到,這是一種有失公允的見解。就神奇精妙而言,詞語世界並不遜於語法世界,甚至還更勝一籌。因為人們不但在造字構詞上表現出與構造短語和句子同樣豐富的創造力,而且在對個別單詞的記憶上也需要用到某種專門的技藝。

回想一下前面提到的「wug測試」,幾乎所有學齡前兒童都可以順利通過。「這是一隻wug,現在這裡有兩隻了,這裡有兩隻______。」在接受測試之前,孩子們既沒有聽過「wugs」一詞,也不曾因為說出「wugs」一詞而得到過獎賞。因此,單詞並不是簡單地從心理檔案中調取出來的,人們必定擁有一套心理規則,能夠在現有單詞的基礎上生成新的單詞,好比說「如果要將名詞變成複數,必須在詞尾加上後綴『-s』」。作為一種離散組合系統,人類語言背後的工程技巧至少表現在兩個不同層面:一是依據句法規則,將單詞組成句子和短語;二是依據一套所謂的「詞法」(morphology)規則,將一些更小的元素組合成單詞。

與其他語言相比,英語詞法的創造力就顯得相形見絀。在英語中,名詞只有兩種形式(「duck」和「ducks」),動詞只有四種形式(「quack」「quacks」 「quacked」和「quacking」)。而在現代意大利語和西班牙語中,每個動詞都有大約50種形式。在古希臘語中,動詞形式達到350種。土耳其語的動詞形式則更為驚人,居然有200萬種!我前面提到的許多語言,如愛斯基摩語、阿帕切語、霍皮語、奇溫久語和美國手語,都以這種驚人的創造力著稱於世。它們是如何做到這一點的呢?我們不妨以奇溫久語為例:奇溫久語是班圖語的一支,據說這種語言與英語比起來就像是國際象棋與國際跳棋。在奇溫久語中,動詞「Naikim′lyiia」的意思是「他在替她吃它」,這個單詞一共由8個部分組成:

● N-:「主題」標記。它表明這個單詞是當前談話的「中心」。

● -a-:「主語一致性」標記。它表示「吃東西的人」屬於16種詞性中的第一性,即「單數的人」(前面已經說過,語言學家所說的「性」與性別無關,而是「種類」的意思)。其他名詞詞性還包括:複數的人、狹窄或長形的物體、成雙或成群的物體、量詞「雙」或者「群」,工具、動物、身體部位、指小詞(事物的縮小狀態或小巧形態)、抽像的特性、準確的位置以及一般的地點。

● -i-:現在時態。班圖語中的時態類型還有:今天、今天早些時候、昨天、不早於昨天、昨天或更早的時候、遙遠的過去、日常性的、正在進行的、連續性的、假設中的、將來發生的、時間未定的、尚未發生的、有時發生的。

● -ki-:「賓語一致性」標記。此處表示「被吃的東西」,屬於第7性。

● -mˊ-:「受益者」標記。它表明該動作的發生是為了誰的利益,此處的受益者屬於16種詞性中的第1性。

● -lyi-:動詞「吃」。

● -i-:「受事」(applicative)標記。它表明在整個動作中多出了一個參與角色,此處指的是受益者。如果用英語來打比方,這就如同要求我們在說到「I baked her a cake」(我為她烤了一塊蛋糕)時,必須在動詞「bake」後加上某種後綴,以區別於「I baked a cake」(我烤了一塊蛋糕)。

● -a:詞尾元音。表明此處是陳述語氣,而非虛擬語氣。

如果你將以上7種前後綴的組合方式全部列舉出來,大致可以得到50萬個結果,而奇溫久語中的每個動詞都有這麼多的可能形式。可以說,奇溫久語和其他類似的語言是將整個句子裝進了一個複雜動詞之中的。

不過,我對英語的看法似乎略欠公平。在「屈折」(inflectional)構詞——通過詞形變化來實現語法功能方面,英語的確顯得簡單粗糙,例如給名詞加上「-s」表示複數,或給動詞加上「-ed」表示過去時態。但是,英語擁有自己的「派生」(derivational)構詞法,即在原有單詞的基礎上派生出新的單詞。比如後綴「-able」可以將表示「去做某事」的動詞轉變為形容詞,表示「能夠做成某事」,例如「learnable」(可學會的)、「teachable」(可教會的)以及「huggable」(可擁抱的)。在英語中,派生後綴的數量多得驚人,以下是一些較為常見的後綴:

此外,英語擁有一套輕鬆自如的「復合」(compounding)構詞法,它可以將兩個單詞靈活地組合起來,構成一個新的單詞,例如「toothbrush」(牙刷)和「mouse-eater」(食鼠怪)。多虧有了這些方法,才使得「詞法貧瘠」的英語可以擁有海量詞語。計算機語言學家理查德·史伯樂(Richard Sproat)曾將美聯社自1988年2月中旬以來的新聞稿件中共計4 400萬個單詞進行了彙集,以便從中梳理出個體單詞的數量。截至當年12月30日,他一共收集到30萬個不同的單詞,大約相當於一部足本英語詞典的收詞量。你或許會認為這一定已經包含了所有可能出現在新聞稿件中的英語單詞,但當史伯樂翻到12月31日的新聞稿時,他又發現了至少35個新詞,如「instrumenting」「counterprograms」「armhole」 「part-Vulcan」「fuzzier」「groveled」「boulderlike」「mega-lizard」「traumatological」和「ex-critters」。

更令人印象深刻的是,每種構詞規則又可以與其他規則相結合,或者進行自我重複,以形成新的單詞。例如,我們可能會說到某些炸薯條是「不可以用微波加熱的」(unmicrowaveability),或者提到某個用來存放牙刷架吸盤的「牙刷架吸盤存放盒」(toothbrush-holder fastener box)。這使得語言中可能擁有的單詞數量更為龐大,它就像句子的數量一樣,可以是無窮無盡的。撇開那些為打破吉尼斯紀錄而杜撰出來的古怪單詞不談,迄今為止,英語中最長的單詞或許是「floccinaucinihilipilification」,《牛津英語詞典》對其的解釋是「將某物看得一文不值」。但紀錄總是要被打破的:

floccinaucinihilipilificational:

與「將某物看得一文不值」有關的。

floccinaucinihilipilificationalize:

使某物與「將某物看得一文不值」有關。

floccinaucinihilipilificationalization:

使某物與「將某物看得一文不值」有關的行為。

floccinaucinihilipilificationalizational:

與使某物與「將某物看得一文不值」有關的行為有關的。

floccinaucinihilipilificationalizationalize:

使某物與使某物與「將某物看得一文不值」有關的行為有關的行為。

如果你患有「恐長字症」(sesquipedaliaphobia)的話,你可以想一想你的曾祖母(great-grandmother),你的曾曾祖母(great-great-grandmother),你的曾曾曾祖母(great-great-great-grandmother),而一共可以有多少個「曾」字,就看你的家族自夏娃以來一共經歷了多少代了。

更重要的是,單詞和句子一樣有精密的層級結構,而並非出自字串機之手(這種機器從某個列表中選取一個元素,再移到下一個列表選取一個元素,然後是再下一個列表……)。當裡根總統提出戰略防禦計劃,也即人們熟知的「星球大戰」計劃時,他設想在未來的世界裡,美國可以用「反導彈導彈」(anti-missile missile)攔截蘇聯發射的導彈,但批評人士指出,蘇聯完全可以用「反反導彈導彈導彈」(anti-anti-missile-missile missile)予以還擊。不過這並不是問題,那些畢業於麻省理工學院的工程師們宣稱,我們只須製造一個反反反導彈導彈導彈導彈」(anti-anti-anti-missile-missile-missile missile)就行。這些高科技武器也需要一種高科技語法,用以記錄單詞的開頭有多少個「anti」,以便在同等數量的「missile」之後再添加一個「missile」,從而結束這個單詞。單詞的結構語法(即單詞的短語結構語法)能夠通過在「anti」和「missile」之間嵌入單詞來實現造詞目的,而字串機則做不到這一點,因為當它移動到這個冗長單詞的末尾時,早已忘記了自己在詞頭部分放置了什麼。

詞是詞干的擴展

和句法一樣,詞法也是一個設計精巧的系統,許多看似古怪的單詞都是其內在邏輯的預期結果。單詞擁有一個精密的結構,構成部件叫作「語素」(morpheme),它們以特定方式組合在一起。單詞的結構系統是X-槓短語結構系統的延伸,在這個系統中,大的名詞性成分建立在小的名詞性成分之上,而小的名詞性成分又建立在更小的名詞性成分之上,以此類推。與名詞有關的最大短語是名詞短語,名詞短語中包含了一個N-槓,而N-槓中包含一個名詞——單詞。我們只需要將這個解剖過程繼續下去,將單詞分解成更細小的名詞性部件,就可以從句法跳到詞法了。

下面是單詞「dogs」的結構圖:

位於這棵小樹頂端的N代表「名詞」,這意味著整個單詞可以插入任何一個名詞短語的名詞插槽之中。在單詞之下的層級中,我們看到了兩個部分:一是名詞原形「dog」,通常被稱為「詞干」(stem);一是複數的詞形變化「-s」。此處涉及的詞形變化規則(即著名的「wug測試」)十分簡單:

N → Nstem Ninflection

一個名詞可以由一個名詞詞干加上一個名詞詞形變化構成。

這一規則能夠與心理詞典很好地銜接:「dog」可以被列為名詞詞干,意為「狗」;「-s」則可以被列為名詞的詞形變化,意為「複數的」。

這是最簡單、也最精練的語法規則。在我的實驗室中,我們將它看作一個易於研究的心理語法實例。通過它,我們可以詳細瞭解語言規則的心理表現,從嬰兒到老年,從正常人到神經受損的患者,這與生物學家通過果蠅來研究基因機制大致相同。將詞干與詞形變化黏連起來的規則雖然簡單,但卻是一項功能強大的運算操作,因為它能夠辨認出抽像的心理符號,例如名詞詞干,而不是與某個特定的單詞、語音或者意義列表相關聯。我們可以將這個規則應用於位於心理詞典「名詞詞干」條目之下的任何項目,而不必在意這個單詞的含義。我們不僅可以將「dog」轉變成「dogs」,還可以將「hour」轉變成「hours」、「justification」轉變成「justifications」。同樣,這個規則允許我們將任意一個名詞轉換成複數,而不必管它的讀音是什麼,我們同樣懂得如何將不規則發音的單詞變成複數,例如「the Gorbachevs」「the Bachs」。同樣的道理,這個規則可以完美地應用到全新的名詞上,例如「faxes」「dweebs」「wugs」和「zots」。

正因為我們可以毫不費力地運用這個規則,所以也許只有將它和許多計算機學家標榜為未來潮流的計算機程序進行對比時,才能吸引些許讚賞的目光。這些被稱作「人工神經網絡」(artificial neural networks)的程序運用的是不同的規則,它們依靠的是類比。「wug」之所以應該轉變成「wugged」,是因為它與網絡所能識別的「hug-hugged」「walk-walked」等成千上萬個動詞變形實例大體相似。但是,當網絡碰到一個與以往經驗毫不類似的全新動詞時,它就不知所措了,因為這種網絡缺乏一個抽像的、包羅萬象的範疇「動詞詞干」助它一臂之力,為它添加詞綴。我們不妨將人和人工神經網絡在「wug測試」中的一些典型做法進行對比:

同樣,詞干也可以由位於復合詞較深層級的部分構成,例如復合詞「Yugoslavia report」(南斯拉夫報告)、「sushi-lover」(壽司愛好者)、「broccoli-green」(西蘭花般的綠色)、「toothbrush」(牙刷):

這兩個詞干連在一起,構成一個新的詞干。規則如下:

Nstem → Nstem Nstem

一個名詞詞干可以由一個名詞詞干加上另一個名詞詞干構成。

在英語中,復合詞通常由一個連字符來連接,或者直接將兩個單詞合併而成,不過也可以將兩個部分分開拼寫,就像兩個獨立的單詞。這種情況往往會讓你的語法老師產生混淆,他會告訴你說,這裡的「Yugoslavia」(南斯拉夫)是一個形容詞。然而,只要將「Yugoslavia」和真正的形容詞(如「interesting」)進行一番比較,你就知道語法老師的說法並不正確,你可以說「This report seems interesting」(這份報告似乎很有趣),但不能說「This report seems Yugoslavia」(這份報告似乎很南斯拉夫),這是區分復合詞與短語的一個簡單方法。復合詞的重音通常落在第一個單詞上,而短語的重音則往往在第二個單詞上。例如短語「dark room」指的是沒有光亮的房間,而復合詞「dark room」(暗室)則是指攝影師沖洗照片的暗室,在沖洗完照片之後,暗室是可以開燈的。短語「black board」指的是黑色的木板,而復合詞「blackboards」(黑板)則可以是綠色的,甚至可以是白色的。如果缺乏讀音或標點上的線索,一些字串既可以被看作是短語,也可以被看作是復合詞。例如下面幾則新聞標題:

Squad Helps Dog Bite Victim

警方救護被狗咬傷的受害者。——又可理解為:警方助狗咬傷受害者。

Man Eating Piranha Mistakenly Sold as Pet Fish

吃人的水虎魚被誤作為觀賞魚出售。——又可理解為:吃水虎魚的男人被誤作為觀賞魚出售。

Juvenile Court to Try Shooting Defendant

少年法庭審問槍擊事件的被告。——又可理解為:少年法庭試圖槍擊被告。

舊的詞干加上某種詞綴(前綴和後綴),也可以形成新的詞干,例如「-al」「-ize」和「-ation」。通過循環使用這些詞綴,我可以製造出長度無限的單詞(就像「sensationalizationalization」)。舉例而言,動詞加上「-able」可以創造出一個形容詞,如「crunch-crunchable」,後綴「-er」可以將任何動詞變成名詞,如「crunch-cruncher」,後綴「-ness」可以將任何形容詞變成名詞,如「crunchy-crunchiness」。

它的結構規則是:

Astem →Stem Astemaffix

一個形容詞詞干可以由一個詞干加上一個後綴構成。

在心理詞典中,後綴「-able」的條目大體如下:

-able:

形容詞詞干的詞綴

意思:能夠被X的

附著於動詞詞干之上

與屈折變化一樣,詞干詞綴也具有雜交性,它可以與正確類別下的任何詞干進行匹配,所以我們可以創造出「crunchable」「scrunchable」「shmooshable」「wuggable」等一系列形容詞,它們的含義也是可預測的:「能夠被壓碎的」「能夠被碾碎的」「能夠被緩解的」,甚至「能夠被wugged的」,無論wug的意思是什麼。當然,我可以找到一個例外:句子「I asked him what he thought of my review of his book, and his response was unprintable」(我問他怎麼看待我為他的書所寫的評論,他的回答是不宜刊登的),「unprintable」一詞的意思比「incapable of being printed」(不能夠被刊登出來)更具深意。

我們可以依據構成元素的意義來計算整個詞干的意義,這類似於句法中所使用的方法。一個特殊的元素是中心語,它決定了整個單詞的指涉對象。正如短語「the cat in the hat」涉及的是一隻貓,「cat」是它的中心語一樣,「Yugoslavia report」涉及的是一份報告,「shmooshability」涉及的是一種能力。因此,「report」和「ability」是這些單詞的中心語。英語單詞的中心語就是位於最右邊的語素。