讀古今文學網 > 語言本能:探索人類語言進化的奧秘 > 元音和輔音 >

元音和輔音

要理解語音的本質,我們有一個簡單的方法,即考察一股氣流是如何從腹部開始經由聲道傳播於口外的。

在說話時,我們會改變正常的呼吸頻率,更為快速地吸入空氣,然後借助肋部肌肉的力量抵消肺部的彈性回縮,將它平緩地釋放出來。如果不這樣做,我們說的話聽起來就會像氣球放氣時發出的聲音,單調而乏味。在這裡,語法比二氧化碳更有優先權:我們抑制住調節身體攝氧量的呼吸循環系統,將呼氣時間延長到一個短語或者句子的長度。這可能會導致輕微的呼吸過度或者缺氧,從而也解釋了為什麼發表一場公共演說是如此累人,以及為什麼我們很難一邊跑步一邊和他人交談的原因。

氣流離開肺部,沿氣管上行,直達喉頭(也就是我們可以看見的咽喉的突起部位喉結)。喉頭類似於一個閥門,中間有一道縫隙,即聲門,聲門兩側分別覆蓋著一片可以自由伸縮的肌肉組織,也就是人們所說的聲帶(不過它更準確的名稱是聲襞,因為它並非如早期解剖學家所認為的那樣是一種帶狀組織)。聲帶能夠關閉聲門,從而將氣流密封在肺部。這可以幫助我們鼓起自己的上半身,就像紮緊的氣囊一般。如果你試圖在不使用雙手的情況下從椅子上站起來,你就會感覺到自己的喉頭是緊縮的。在出現咳嗽、排便等生理行為時,喉頭也會關閉。舉重運動員或者網球選手在發力時會發出嘶吼,也說明了我們是使用同一個器官來密封肺部和製造聲音的。

聲帶也可以部分地閉合聲門,使得氣流在通過聲門的時候發出嗡鳴的聲音。這是因為高度壓縮的氣流將聲帶向外推開,而聲帶又會迅速反彈,將聲門關閉,直到氣流壓力不斷累積,迫使它再度打開,從而開始一個新的循環。因此,一股氣流被化整為零,間斷性地釋放出來,由此發出一種嗡鳴聲,我們稱之為「濁音」(voicing)。你可以試著分別發出「ssssssss」和「zzzzzzzz」的聲音,前者是不帶聲的清音,後者是帶聲的濁音。

聲帶的開合頻率決定了聲音的音高。通過改變聲帶的張力和位置,我們可以控制它的開合頻率,由此也可以控制音高。這一點最明顯地表現在哼歌或唱歌時,但在說話的時候,我們也會在一句話中不斷地改變音高,這一過程就是「語調」(intonation)。正常的語調使得人類在語言發音上有別於科幻電影中的機器人以及《週六夜現場》節目中的尖頭外星人。語調也可以用來表示諷刺、強調以及說話者的喜怒哀樂等情緒。在所謂的「聲調語言」(如漢語)中,人們通過升降調來區分詞義。

雖然濁音產生的聲波擁有主要的振動頻率,但它與音叉或應急警報等只擁有一個頻率的純音不同。濁音是一種頻率豐富、擁有多種「諧波」(harmonic)的聲音。例如,男聲聲波的振動頻率不僅限定於100Hz,還包括200Hz、300Hz、400Hz、500Hz、600Hz、700Hz直至4 000Hz以上,女聲聲波的振動頻率則包括200Hz、400Hz、600Hz不等。在這裡,聲源的豐富性就顯得至關重要,它為聲道的其他部分製造元音和輔音提供了原料。

如果我們由於某種原因不能用喉頭發聲,則可以借助任何一種頻率豐富的聲源來實現這一點。在低聲耳語時,我們的聲帶是平展的,這導致氣流沿著聲帶邊緣四散開來,從而形成一種紊流或噪聲,聽起來就像「嘶嘶」的聲音或者無線電靜態噪聲。這種「嘶嘶」聲並不是由一系列諧波構成的不斷重複的聲波,如我們說話時發出的週期性聲音,而是一種忽高忽低的鋸齒狀聲波,由時刻變化的頻率混合而成。然而,這一混合材料正是聲道的其餘部分用來製造竊竊私語的原料。一些被切除喉頭的患者能夠學會用食管發聲,或者通過打嗝的方法來製造必要的聲音;有些人則在自己的頸部放置振動器。20世紀70年代,吉他手彼得·佛萊普頓(Peter Frampton)就將電吉他的擴聲通過管道傳入嘴中,好讓自己能夠在演唱時發出弦音,正是這種弦音效果助其收穫了搖滾生涯中的兩張熱賣唱片。

這股振頻豐富的氣流在離開身體之前,還要穿過一段狹長的空腔:它包括舌頭後面的咽喉、舌頭和上顎之間的口腔、雙唇的開合部位以及另一條備用通道:鼻腔。每段空腔都具有特定的長度和形狀,能夠通過「共振」(resonance)的方式對穿過的聲音產生影響。不同頻率的聲音有不同的波長(即聲波波峰之間的距離),音調越高,波長就越短。在通過具有一定長度的管道時,聲波會在到達管道的另一端時向後反彈。如果管道的長度和聲波的波長形成一定的比例,每個反彈的回波都會增強下一個來波。如果長度不同,那麼回波和來波就會互相干擾,這就好比蕩鞦韆,如果你能在鞦韆蕩得最高的時候稍加推力,就能收到最好的效果。因此,一個特定長度的管道能夠放大某種頻率的聲音,並過濾掉其他頻率的聲音。你可以通過給一個瓶子注水來體驗這種效果:攪動的水聲被水面和瓶子開口之間的空氣柱過濾,水越多,空氣柱就越短,共振頻率也就越高,水聲也就越小。

我們聽到的各種元音,都是對喉頭所發出的聲音進行放大或過濾的結果,只不過在組合方式上有所不同。通過移動口腔中的5個發音器官的位置,我們可以改變共振腔的形狀和長度,以形成不同的組合共振。例如,[ee]這個音是由兩種共振組合而成,一種是以喉腔為主的共振,頻率介於200~350Hz之間,另一種則是以口腔為主的共振,頻率介於2 100~3 000Hz之間。一個空腔過濾的頻率範圍與進入該空腔的特定的頻率組合併不相干,因此,無論是說話還是耳語、高歌還是低唱、嗝音還是鼻音,所有的[ee]音聽起來都是一個音。

舌頭是最重要的言語器官,因此語言也的確稱得上是一門「舌頭的藝術」。實際上,舌頭是三個器官的總和:舌尖、舌面和舌根(即與下顎相連的肌肉)。如果你重複地發「bet」和「butt」中的元音:[e-uh]、[e-uh]、[e-uh],就能夠感覺到舌面在向前和向後反覆移動(你可以通過將手指放在上下牙齒之間來感覺這種移動)。當舌頭位於口腔前部時,它可以拉長舌頭與喉嚨之間的空腔,同時縮短舌頭與雙唇之間的空腔,從而改變聲音的共振方式。在發「bet」的元音時,口腔可以放大振頻為600Hz和1 800Hz的聲音;而在發「butt」的元音時,口腔放大的是振頻為600Hz和1 200Hz的聲音。現在請你試著交替發出「beet」和「bat」的元音,你會發現舌面在上下跳動,運動軌跡正好與「bet-butt」的舌部運動相垂直,你甚至可以感覺到自己的下顎也在跟著舌頭一起運動,以便形成發音。這種運動同樣能夠改變喉嚨和口腔的形狀,從而改變聲音的共振。大腦則將不同方式的放大和過濾解讀為不同的元音。

舌部運動與元音之間形成的緊密聯繫導致了一個頗為奇特的現象,這種現象出現在包括英語在內的許多語言之中,即「語音象徵主義」(phonetic symbolism)。當舌頭較高,且位置靠前時,形成的是一個空間較小的共振腔,它放大的都是高頻率的音。由此一來,以這種方式產生的元音(例如[ee]和[i])常常讓人們聯想到微末之事。與此相對的是,當舌頭較低,且位置靠後時,形成的則是一個空間較大的共振腔,它放大的都是低頻率的音,由此產生的元音(例如「father」中的[a]以及「core」「cot」中的[o])常常讓人們聯想到龐然大物。因此在英文中,老鼠被叫作「mice」,它體型很小(teeny),聲音尖細(squeak);而大象則被稱為「elephant」,它體型龐大(humongous),聲音洪亮(roar)。又比如,音箱上的高音揚聲器(tweeter)的口徑總是比低音揚聲器(woofer)的口徑小。此外,以英語為母語的人能夠準確地猜出漢語裡的「輕」(ch』ing)字代表重量小,「重」(ch』ung)字代表重量大(在針對大量外語單詞的對照研究中,被試的準確率高於隨機猜測,儘管不是特別明顯)。我曾經向我身邊一位計算機達人請教過「frob」一詞的意思,她生動形象地給我上了一堂「黑客英語」輔導課:假設你為自己的立體音響添置了一台新的圖示均衡器,首先,你會漫無目的地上下移動控制按鈕,以測聽這台設備的一般效果,這就是「frobbing」(調著玩)。然後,你會通過適度地移動旋鈕,找出自己喜歡的音段,這就是「twiddling」(扭轉)。最後,你會做出更為細微的調整,以獲得最完美的音質,這就是「tweaking」(微調)。根據這段解釋,「ob」「id」和「eak」的發音恰好符合語音象徵主義的大小規則。

你是否願意冒著被娛樂節日《60分鐘》(Sixty Minutes)主持人安迪·魯尼(Andy Rooney)附體的風險,想一想我們為什麼不將「fiddle-faddle」(無聊)說成「faddle-fiddle」,不將「ping-pong」(乒乓球)說成「pong-ping」,不將「pitter-patter」(辟啪聲)說成「patter-pitter」?為什麼我們不能用「span and spic」來形容廚房的整潔,而必須說「spic and span」。同樣,為什麼我們必須說「riff-raff」「mish-mash」「flim-flam」「chit-chat」「tit for tat」「knick-knack」「zig-zag」「sing-song」「ding-dong」「King Kong」「criss-cross」「shilly-shally」「see-saw」「hee-haw」「flip-flop」「hippity-hop」「tick-tock」「tic-tac-toe」「eeny-meeny-miney-moe」「bric-a-brac」「clickety-clack」「hickory-dickory-dock」「kit and caboodle」「bibbity-bobbity-boo」?答案是:舌位高而前的元音往往居於舌位低而後的元音之前。沒有人知道為什麼這些單詞要按照這樣的順序結合在一起,但它似乎能夠以三段論的形式,通過另外兩種奇特的現象推導出來。第一,包含「我、此時、此地」之意的單詞往往擁有舌位高而前的元音,而遠離「我、此時、此地」的單詞則擁有舌位低而後的元音,如「me」與「you」、「here」與「there」、「this」與「that」。第二,在排列順序上,包含「我、此時、此地」之意的單詞往往排在前面,而在字面上或意味上遠離「我」(或者說話者本人)的單詞則排在後面,例如「here and there」(而非「there and here」)、「this and that」「now and then」「father and son」「man and machine」「friend or foe」「the Harvard-Yale game」(哈佛大學的叫法)、「the Yale-Harvard game」(耶魯大學的叫法)、「Serbo-Croatian」(塞爾維亞人的叫法),「Croat-Serbian」(克羅地亞人的叫法)。因此,這個三段論可以表述為:

前提一:「我」=高前元音,

前提二:「我」通常位於前排,

結論:高前元音通常位於前排。

接下來讓我們考察一下其他的言語器官。你可以試著交替發出「boot」和「book」的元音,並注意自己的嘴唇變化。當你發「boot」的音時,你的嘴唇呈圓形並向前突出,這等於在聲道前端增加了一個空腔。這個空腔擁有自己的共振值,可以放大和過濾其他振頻,使其發出的元音和其他元音形成明顯的差別。正是由於唇形變化對聲音效果的影響,我們才能在與興高采烈的人通電話時「聽」到他的微笑。

還記得你的小學老師曾經教過的內容嗎?「bat」「bet」「bit」「bottle」「butt」中的元音是「短音」,「bait」「beet」「bite」「boat」「boot」中的元音是「長音」。你當時是不是根本不知道她在說什麼?很好,請把它們統統忘掉吧,這些知識早已是陳年往事。早期英語往往通過元音發音的快慢來區分單詞,這有點兒像現代英語中「bad」(壞)與「baaaad」(好)的區別。但到了15世紀,英語的發音經歷了一場大地震,史稱「元音大轉移」(Great Vowel Shift)。通過舌根的前移,那些原本發音較長的元音變成了「緊元音」,即發音時舌頭緊繃,舌面隆起,而不像以前那樣鬆弛扁平。隆起的舌面縮小了口腔上方的空腔,改變了聲音的共振。此外,現代英語中的一些緊元音,比如「bite」和「brow」的元音,屬於「雙元音」(diphthong),即兩個元音快速、連續地發音,聽起來就像是一個元音,如「bite」讀作[ba-eet],「brow」讀作[bra-oh]。

如果你盡可能地拉長「Sam」和「sat」的元音,推後詞尾的輔音,就能聽到第5個言語器官的音響效果。在大多數英語方言中,元音會因為被拉長而發生變化,例如「Sam」中的元音在被拉長後會帶有濃重的鼻音,這是因為軟顎(位於硬顎之後的肌肉組織)的張開使得空氣得以從鼻腔通過。鼻腔也是一個共振室,當振動的空氣從中經過時,它會放大和過濾另一組頻率。在英語中,人們不會根據元音是否帶有鼻音來區分單詞,但是像法語、波蘭語和葡萄牙語等許多語言卻是這麼做的。有些以英語為母語的人即便在說「sat」時也會把軟顎張開,但我們只會認為這是帶有鼻音而已,並不會把它聽成另一個單詞。當你因為感冒而出現鼻塞的症狀時,打不打開軟顎就沒有什麼分別了,此時你的發音顯然不帶鼻音。

到目前為止,我們探討的都是元音。在發這些音時,氣流從喉頭出發直達外界,整個過程暢通無阻。如果氣流在途中遇到某種阻礙,就形成了輔音。你可以試著發出「ssssss」的音,為了發這個音,你必須將舌尖(第6個言語器官)抬起,使之與牙床相抵,只留下一道細小的開口。如果你強迫氣流穿過這個開口,這股氣流就會洶湧地激盪開來,並發出「噪聲」。根據開口的大小以及開口之前的諧振腔的長度,噪聲中的某些聲波會比其他頻率的聲波聽起來更為響亮,這些聲波的波峰和頻率範圍決定了[s]的音色。此外,這個噪聲的產生是源自氣流的摩擦,因此這類聲音也被稱為「擦音」(fricative)。如果將急促的氣流從舌頭和上顎之間擠出來,就可以得到[sh]的音;從舌頭和牙齒之間擠出來,就可以得到[th]的音;從下唇和牙齒之間擠出來,就可以得到[f]的音。此外,我們還可以通過舌面或者聲帶的移動來製造湍流,以發出「ch」在德語、希伯來語、阿拉伯語中的不同讀音,例如「Bach」(巴赫)、「Chanukah」(光明節)等。

現在請你發一下[t]的音。你可以感覺到,舌尖同樣對氣流形成了阻礙,但這一次它沒有留下任何縫隙,而是完全阻塞了氣流的前進。隨著壓力的增大,你猛然間放開舌尖,讓氣流噴湧而出(笛手們正是通過這種方式來分奏不同的音符的)。其他的「塞輔音」(stop consonant)還有:通過閉合雙唇發出的[p]音、通過將舌面抵住上顎發出的[k]音以及由喉頭發出的喉塞音(如「uh-oh」中的輔音)。當你發出一個塞輔音時,聽者往往要經歷以下三個階段:首先,什麼聲音都沒有,因為氣流被障礙物完全阻塞,此時的塞輔音就像是「寂靜之聲」。然後,隨著氣流的釋放,突然爆發出一種急促的噪聲,它的振動頻率取決於開口的大小和諧振腔的長度。最後,隨著舌頭滑動到下一個元音的發音位置,濁音逐漸加強,由此過渡為平緩變化的共振。正如我們將要看到的,這種三級跳式的發音方式令語音識別工程師痛苦不堪。

最後請你再發一下[m]的音。你雙唇緊閉,就和發[p]音一樣,但這一次氣流並不是被無聲地阻塞在空腔中,你可以持續地發出[mmmmm]的音,直到透不過氣來。這是因為你在緊閉雙唇的同時張開了軟顎,使得所有空氣得以通過鼻腔釋放出來,這時發出的聲音是在鼻腔和前部口腔的共振下被放大的結果。此時如果開啟雙唇,就會產生一種平緩變化的共振。從形式上看,這個共振與[p]音的共振非常相似,只是它無須經過「寂靜-爆發-加強」這三個階段。[n]的發音原理與[m]類似,只不過阻礙氣流通行的是舌尖,同時,舌尖也是[d]和[s]的發音器官。此外,「sing」中的輔音[ng]也如此發音,只是阻礙氣流通行的是舌面部分。

那麼,我們為什麼說「razzle-dazzle」而不說「dazzle-razzle」?為什麼是「super-duper」「helter-skelter」「harum-scarum」「hocus-pocus」「willy-nilly」「hully-gully」「roly-poly」「holy moly」「herky-jerky」「walkie-talkie」「namby-pamby」「mumbo-jumbo」「loosey-goosey」「wing-ding」「wham-bam」「hobnob」「razza-matazz」「rub-a-dub-dub」?恐怕你從未想過這些問題。輔音之間的區別源自氣流的阻塞程度:僅僅是使它產生共振,還是迫使它以噪聲的形式通過障礙,又或者是完全阻止它的通行。以阻塞小的輔音開頭的單詞通常位於以阻塞大的輔音開頭的單詞之前,但這又是為什麼呢?