讀古今文學網 > 盲眼鐘錶匠:生命自然選擇的秘密 > 第五章 基因檔案 >

第五章 基因檔案

外邊兒正在下DNA。

我的花園盡頭,就在牛津運河邊,有一棵很大的柳樹,它正在釋放大量的種子。柳絮迎風飄揚。風向不定,四面八方都是柳絮。運河上上下下,以我的雙筒望遠鏡望去,河面上儘是白茫茫一片,其他方向,想必也是柳絮鋪地。柳絮是因為表面有白色的絨毛、柔軟如絮而得名,絨毛的成分是纖維素,藏在其中的種仁,就體積來說簡直微不足道,種仁裡裝著DNA—遺傳信息。滿天的柳絮裡,DNA只佔微小的比例,為什麼我說天上正在下DNA,而不說外邊正在下纖維素呢?答案是:DNA才重要。纖維素絨毛儘管體積龐大,不過當作降落傘,用過就丟的。浮生若夢。柳樹這齣戲,棉質絨毛、花、樹的本體等等,都是配角,主戲只有一場,情節只有一個,就是在鄉間散佈DNA。可不是任何DNA,而是建造另一棵柳樹的DNA,更精確地說,是含有特定文本的DNA,那分文本是編過碼的特定指令集,新的柳樹在那套指令指揮之下發芽、成長、茁壯,然後開始散佈新一代的柳絮。飄散在空中的柳絮,正在散佈製造自己的指令,不多也不少。它們現在隨風飄散,正因為同樣的事它們的祖先做得很成功。外邊兒滿天下的都是指令,滿天下的都是程序,都是讓柳樹發育、柳絮飄揚的算則(algorithm,有明確執行步驟的指令集)。那不是隱喻(metaphor),而是明擺著的事實。即使我說天上正在下磁盤片,也不會更明白。

這是明擺著的事實,可是大家一直不瞭解。才不過幾年前,要是你問:「生物有什麼特質,好與無生物分別的?」幾乎每一個生物學家都會跟你大談什麼原生質(protoplasm)。原生質與任何其他物質都不同;它有生機,有活力,是動態的,有韻律的,對刺激有反應的。老師賣弄這些詞藻,說穿了不過是指出原生質「會對外界刺激有所反應」(responsive)。要是你找來一個活的生物,將它逐步分解,最後就會得到純原生質的小顆粒。當年「達爾文鬥犬」赫胥黎(Thomas Huxley,1825~1895)相信海底有一層純原生質的生物(bathybius),它們是「均質、沒有結構的物質,一種活的蛋白質顆粒,有營養、生殖功能」。德國演化論大師赫克爾(Haeckel,1834~1919)認為這種「單質生物」(monera)是最原始的生物。我小時候這個概念已經過時了,可是老式教科書上還在講原生質。現在這個詞沒有人提了,就像化學的「燃素」、物理的「以太」(aether),「原生質」已經死了。構成生物的物質沒什麼特別的。生物是分子的集合體,與其他的東西一樣。

這些分子的特殊之處是:生物分子構造比較複雜,必須按照程序製造這些分子。程序是成套的指令,生物體內都有,生物就是按照體內程序發育的。生物也許有生機、有活力、是動態的、有韻律的,總之,對刺激會反應,而且有體溫,但是這些性質全是突現的(emerge),附帶的。每一個生物的核心,不是火,不是溫暖的氣息,不是「生命的火花」,而是信息、字、指令。如果你想打個比方,別想火啊、氣息、火花什麼的。試試「刻在芯片上的幾十億個離散狀態的數字字符」。如果你想瞭解生命,忘了有活力的、會跳動的原生質還是別的什麼,想想信息技術。我在上一章結束的地方提到蟻後是中央數據庫,暗示的正是這一點。

先進信息技術的基本需求,是某種記憶容量超大的儲存媒體。媒體中每個記憶位置都能處於幾個離散態中的某個特定「態」。現在人工製品世界的主流技術—數字信息技術—正有這種特色。信息技術也可以走另一條路,就是以模擬信息為基礎。過去的膠盤唱片儲存的就是模擬信息—儲存在波狀的溝槽裡(以唱針「讀」取)。激光唱片(CD)儲存的是數字信息,記錄在唱片上一系列微小的「坑」裡,每個對應一個特定離散態,絕無模稜之處。那是數字系統的診斷特徵:它最基本的要素不是處於一個狀態,就是另一狀態,沒有半個狀態的,也沒有中間狀態的。

基因的信息技術是數字式的。這個事實是19世紀的孟德爾(Mendel,1822~1884;他的家鄉現在捷克境內)發現的,當然,他還沒有「數字信息」的概念。孟德爾以豌豆做實驗,演繹出的結論是:生物的子代不是親代基因「混合」的結果。我們從親代接收的「遺傳」是以分離的粒子形式進入合子(受精卵)的。就每一個特定遺傳粒子而言,我們不是從親代得到了,就是沒有得到。其實,正如數學遺傳學家費希爾(R. A. Fisher,1890~1962)指出的,這個「粒子遺傳」事實是顯而易見的,只要想想有性生殖就成了。我們的父母(親代)是一男一女(或一雄一雌),但是我們不是男就是女,沒有「中間態」(雌雄莫辨)的。每個新生兒從父母親遺傳男性或者女性的概率大約相等,但是任何一個新生兒不是男孩就是女孩,不會兩者混合(加起來除以二?)。我們現在知道所有我們從父母繼承的粒子都是這樣。它們不會混合,即使在世代遺傳過程中它們會不斷地被「洗牌」(重新組合)。當然,諸遺傳單位對身體的影響往往會造成「它們混合了」的強烈印象。要是一個高個子與一個矮個子,或者一個白人與一個黑人結婚了,他們的子女往往看來是「中間型」。但是「混合」的表現只適用於遺傳粒子對於身體的影響,因為影響身體的粒子數量很大,而每個遺傳粒子對身體都有微小的影響,身體表現的是大量粒子影響力的集合。可是在遺傳過程中,遺傳粒子彼此獨立、不相混合。

混合遺傳與粒子遺傳的區別,在演化思想史上非常重要。達爾文在世時,每個人都相信遺傳就是親代特質的混合。(只有孟德爾例外,他的劃時代論文於1865年發表,四年後又宣讀了另一篇,可是他1868年當選修道院的「住持」,無暇再接再厲或宣傳自己的研究成績,學界到19世紀結束時才覺悟他的結論的意義。)蘇格蘭電機工程師弗萊明·傑肯(Fleeming Jenkin,1833~1885)1867年(當時是倫敦大學電機工程學教授)指出:光是混合遺傳這個事實(譯按:這是當時的流行意見),自然選擇就不可能是值得考慮的演化機制。達爾文的反應是:(傑肯教授)「缺乏知識」。一個多世紀後,哈佛大學德裔美籍演化論大師邁爾(Ernst Mayr,1904~2005)對傑肯仍不同情。他於1982年評論道:傑肯《評〈物種起源〉》立論完全「基於當時物理科學家流行的偏見與誤解。」然而,傑肯的論證卻讓達爾文十分憂慮。傑肯以一個船難寓言將他駁斥自然選擇論的意旨發揮得淋漓盡致。話說船失事後,有一個白人船員漂流到一個有黑人土著的小島上……

讓我們假定這位白人擁有一切我們所知優於黑人的天賦;我們同意:在生存競爭的戰場上,他享高壽的機會比土著酋長大多了;然而,即便如此,我們也無法推出這麼一個結論:過了若干世代之後(暫不管確切的數字),島民就會成為白人。我們的白人船難英雄可能會當上小島的國王;為了生存,他會殺死許多黑人土著;他會有許多妻子,生許多孩子,而他的臣民中有許多男人因娶不到老婆而絕後……我們白人的優異天賦無疑會讓他活到高壽,但是他一個人無論花多少世代也不可能將他臣民的後裔變成白人……在第一子代中,有許多聰明的年輕混血兒,平均說來比黑人優秀多了。我們也許可以期望以下幾個世代國王寶座都由多少可說是黃皮膚的人佔據;但是有人相信島上整個族群都會逐漸變成白人嗎,甚至黃人?或島民會逐漸變得有活力、有勇氣、有智巧、有耐心、有毅力、能自制?—我們的白人英雄不就是憑著那些天賦打敗島民、留下大量子裔的?!事實上這些質量正是在生存競爭中淬煉出來的,不是嗎?(譯按:19世紀的西方學者認為黃種人介於白種人與黑種人之間,處於黑人「進化」成白人的過渡階段。)

請讀者不要被傑肯論證中瀰漫的白人優越意識岔開了注意力。在傑肯與達爾文的時代,這些種族偏見(racism)就像我們習以為常的物種(species)優越意識一樣,「人」權、「人」的尊嚴、「人」命是神聖的等等,是有識之士隨口就能大談的東西。我們可以用比較中性的例子改寫傑肯的論證。如果你混合白漆與黑漆,就會得到灰漆。可是將灰漆與灰漆混合,無法還原白漆與黑漆。混合漆的實驗足以代表孟德爾遺傳定律大白於世之前的遺傳學,即使到了現在,通俗文化中仍然保留了「一加一除以二」的血液混合遺傳觀念。傑肯的論證其實就是「淹沒」效應。依據混合遺傳的假設,隨著世代交替,少數個體的優異天賦必然會逐代「淹沒」、沖淡。整體而言,個別性逐代抹殺,於是族群就「統一」了,根本沒有自然選擇的餘地。而個體間的遺傳差異是自然選擇的原料。

這個論證你一定覺得非常可信,可是它不只是駁斥自然選擇的論證,它還駁斥了遺傳過程中無法抵賴的事實!它擺明了就不對,個體間的差異何曾在世代交替過程中消失?!我們彼此間的差異並不比我們祖父母那一輩還要小。個別差異仍然維持著,不多也不少。族群中有個別差異,足夠自然選擇運作。這是1908年德國醫師溫伯格(Wilhelm Weinberg,1862~1937)與英國數學家哈代(G. H. Hardy,1877~1947)殊途同歸,以數學指出的事實(即高中生物學課本中的「哈—溫定律」)。哈代是個不同流俗的學者,他當年(1919~1931)在牛津大學擔任過幾何學講座教授,就待在我這個學院裡(新學院,New College,14世紀末成立),他在我們學院的「打賭簿」上留下了一段佳話。原來他接受了一位同事半個便士的賭金(近1/480鎊),拿全部家產賭「太陽明天仍然會升起」。但是以孟德爾「遺傳粒子」(基因)理論完整地破解了傑肯的論證的,是費希爾等人領導的生物統計學派,他們奠定了現代族群遺傳學的基礎。在當時這頗令人尷尬,因為這批20世紀初期孟德爾信徒的領袖人物都自認為是反達爾文的(見最後一章)。費希爾等人證明了:要是在演化中變化的是各個遺傳粒子(基因)的相對頻率,而且任何一個生物個體中各個基因不是「有」就是「沒有」,那麼達爾文的自然選擇理論就講得通了,傑肯的問題因而漂亮地解決了。1930年,費希爾的經典著作《自然選擇的遺傳理論》出版之後,「新達爾文主義」(neo-Darwinism)之名便不脛而走。它的數字本質可不是個恰巧與遺傳信息技術吻合的事實。搞不好生物遺傳的數位性質是達爾文演化論必要的先決條件。

在我們的電子技術中,離散的、數字的位置每個都只有兩種狀態,依慣例以 0與1表示,當然你也可以用高與低、開與關、上與下來表示,只要它們不會混淆,而且它們的狀態模式可以「讀取」(傳訊),以影響某個事物即可。電子技術使用各種材質儲存以0與1編碼的信息,例如磁盤、磁卡、打孔卡片、打孔帶,以及智能芯片(其中包括大量微小的半導體單位)。

所有其他生物細胞,管它是柳樹種子、螞蟻還是什麼的,主要以化學媒體儲存信息,而不是電子媒體。這種媒體利用某些分子種類的「聚合」(polymerizing)性質儲存信息。所謂聚合,就是分子彼此相連、成一長鏈,而且長度沒有限制。聚合體有許多種。舉個例子來說,聚乙烯是乙烯(一種小分子)聚合成的長鏈。澱粉與纖維素是聚合糖。有些聚合體是由一種以上的小分子聚合成的,與聚乙烯不一樣。一旦聚合體有了異質性(長鏈由一種以上的分子聚合成的),理論上就可供信息技術利用。要是聚合體長鏈由兩種小分子構成,它們就可以分別代表0與1,於是任何數量、任何種類的信息都可以儲存在這種聚合體長鏈上,只要分子鏈夠長。生物細胞利用的聚合體是多核甘酸(polynucleotides)。在生物細胞中多核甘酸有兩個主要的家族,簡稱DNA與RNA。它們都是核甘酸組成的長鏈。DNA與RNA都是異質鏈,由四種不同的核甘酸組成。當然,這正是它們可以用來儲存信息的理由。生物細胞的信息技術使用的不是二態碼(0與1),而是四態碼,按慣例以A、T、C、G代表(即四種核甘酸的英文縮寫)。就原理來說,我們使用的二態信息技術與生物細胞的四態信息技術沒什麼不同。

我在第一章結束時說過,每個人體細胞用來儲存信息的空間,足以容納三四套《大英百科全書》(一套30冊)。我不知道柳樹種子或螞蟻細胞的信息容量,但是它們應該與人類屬於同一個數量級。一粒百合種子或蠑螈(salamander,一種兩棲類)精子儲存的信息量相當於60套《大英百科全書》以上。變形蟲是原生生物,夠「原始」了吧?可是變形蟲有些物種,細胞核DNA足以儲存相當於100套《大英百科全書》的信息。

令人驚訝的是:有些生物細胞的遺傳信息,似乎只有1%實際派上用場,人類細胞就是一個例子,大約相當於一冊《大英百科全書》。其他的99%為什麼會在細胞中?沒有人知道。我曾經指出它們也許是「寄生蟲」,占那1%的便宜,它們搭便車進入細胞中,這個理論最近分子生物學家很感興趣,為它取了個名字,叫它「自利的DNA」。細菌攜帶的遺傳信息比人類細胞少得多,大約只有人類的千分之一,可是細菌的遺傳信息也許每一筆都有用:沒有什麼空間容納寄生蟲。細菌的DNA「只」能容納一本《新約》!

現代基因工程師已經發展出適當的技術,能夠將《新約》或任何其他信息加載到細菌的DNA中。任何信息技術使用的符號、意義都可以任意規定,而DNA中有四個核甘酸「字母」(A、T、C、G),我們可以規定:以三個連續的核甘酸「字母」為一組(共有64種組合),每組都對應一個英文字母表中的字母,於是除了大、小寫英文字母(共52個),還可對應12個標點符號。可是把《新約》寫入細菌的DNA中,得花5個「人—世紀」,也就是說,要是一個人來做,5個世紀才做得完,我看不會有人想做的。不過,萬一這工作完成了,以細菌的繁殖率而言,一天就能複製1000萬本《新約》,要是人類能閱讀細菌DNA中的字母多好!傳教士的美夢也不過如此吧?可惜細菌DNA中的字母實在太小了,即使是1000萬本《新約》,仍然能在一根大頭針的「圓頂」上共舞。

計算機的內存一般區分為ROM與RAM兩種。ROM就是「只讀存儲器」。嚴格一點兒說,就是「只能寫入一次,可是能讀許多次」的內存。製造時只要將以0與1編過碼的信息「燒」(寫)入內存內,就萬事大吉了。內存這樣「記下」的信息經久不變,愛讀幾次就讀幾次。至於RAM,它是既能讀又能寫的內存,因此ROM能做的事它也能做,它還能做ROM不能做的事。你隨時可以將信息寫入RAM中的任何地方,愛寫幾次就寫幾次。計算機裡的內存,大部分是RAM。我現在在計算機上打出這些字句,它們全都先存到RAM裡,我的文字處理程序也暫存在RAM裡,但是理論上也可以將它燒在ROM裡,從此不再改變它。ROM裡存的是一組固定的標準程序,計算機在運算過程中會反覆呼叫那些程序,你不能改變它們,即使真心想,也不成。

DNA就是ROM。它可以「讀出」幾百萬次,但是只能「寫入」一次—每個細胞裡的DNA在細胞形成之初就(複製)組裝完畢。任何一個人,身體裡每個細胞的DNA都是「燒入」的,終身不變,偶爾發生罕見的隨機退化倒不無可能。不過,它能複製。細胞一分裂,它就得複製一份。新生兒發育,增加的新細胞數以萬計,每個新細胞的DNA都以先前細胞的DNA為模板,一五一十地複製出來,所有核甘酸(A、T、C、G)的序列都必須忠實無誤。每個個體受孕的那一刻,一套新而獨特的信息模式就「燒入」他的DNA的ROM中,此後終其一生擺脫不了那個模式。那套信息複製到他身體的每個細胞裡(只有生殖細胞例外,他的每個生殖細胞都只得到半套信息,可是由於那半套是臨時隨機組合出來的,因此每個生殖細胞裡的遺傳信息都不相同)。

所有計算機內存,ROM也好,還是RAM,都有「地址」。就是說內存中每個位置都有一個卷標,通常是個數字,但是只要約定俗成,用什麼當標籤都無妨。重要的是:得分別每個記憶位置的地址與內容。每個位置有個地址。舉例來說,我的計算機RAM裡有65536個記憶位置,我剛剛隨手敲進的兩個字母現在登錄在地址6446與6447里。以後那兩個地址裡的內容就不同了。每個位置裡的內容,就是最近寫入那個地址裡的東西。ROM裡每個位置也有地址與內容,只是一旦寫入了任何東西,以後就無法更改了。

DNA是構成染色體的主要分子,它的結構像長的繩梯,平時長梯糾結纏繞,不容易看出頭緒。不過DNA分子倒可比作計算機磁盤。我們身體每個細胞裡的DNA都與ROM或計算機磁盤一樣,上面的每筆信息都有地址卷標。用什麼標記位置,數字也好,名字也好,都不重要。重要的是:我的DNA上任何一個特定位置,你的DNA上都有,絲絲入扣,它們地址相同。我的DNA地址321762的內容,也許與你的DNA地址321762的內容一樣或不一樣。但是我的地址321762在我的細胞中,與你的地址321762在你的細胞中,位置完全一樣。這兒「位置」指的是某一特定染色體上的位置。至於這個染色體在各自的細胞中究竟位於什麼地方,無關緊要。反正染色體懸浮在細胞核中,位置本就不是固定的。但是染色體長軸上的每個位置都有精確的地址,前後有一定的順序,就像計算機磁盤也有精確的地址,即使整卷散亂在地面上,而不是整齊地捲起,憑地址也可以找到需要的段落。我們所有的人,所有「智人」,都有同樣一套DNA地址,至於同一個地址是不是登錄了同樣的內容,則不一定。那是我們彼此不同的主要理由。

物種之間沒有同樣的一套地址。舉例來說,黑猩猩有48個染色體,而我們只有46個。嚴格說來,不同物種不可能比較遺傳信息的內容,因為地址對不上號。不過,親緣關係密切的物種,像人與黑猩猩,染色體上許多「大塊文章」裡都有同樣的內容,連組織都一樣,我們很容易判定它們基本上是相同的,雖然它們並不使用同樣的地址系統。確定不同個體屬於同一物種的判斷標準是:它們的DNA使用同一個地址系統。同一個物種的成員,都有同樣數目的染色體,只有少數例外,而每一條染色體都有同樣的地址、同樣的地址順序。不同個體間的差異,是那些地址中的內容(基因版本)不同導致的。

至於同一地址中的不同基因版本怎樣造成個體間的差異,我現在要解釋,但是我必須先強調:我所說的只適用於實行有性生殖的物種,而我們正是實行有性生殖的動物。我們的精子或卵子,每個都有23條染色體。一個人類精子中的任何一個基因地址,所有其他精子中都有對應的地址,不管是我的精子還是任何人的;卵子中也有。我身體裡其他的細胞都有46條染色體—兩套(成雙)。那些細胞裡同一個地址使用了兩次。每一個細胞裡第9號染色體都有兩條,換言之,「9號染色體地址7230」有兩個。這兩個地址裡的基因版本不一定相同,(同一物種)其他成員的也不一定相同。含有23條染色體的精子,是從含有46條染色體的細胞形成的,同一地址的兩個基因每個精子只得到一個。至於是兩個中的哪一個,就難說了,我們可以假定那與拋硬幣的結果類似—服從隨機定律。卵子也一樣。結果,雖然同一物種的每個個體都使用同一套地址系統(暫不談例外情況),以每個地址中的內容(基因版本)而言,每個精子與卵子都是獨一無二的。卵子讓精子受精後,就有了46條染色體;然後這個受精卵發育成胚胎,每個細胞中的46條染色體,都是受精卵裡46條染色體的復本。

我說過,ROM(只讀存儲器)只有在第一次製造的時候才能寫入,製造完成後就不能寫入了,細胞裡的DNA也一樣,不過在複製的過程中,偶爾會發生隨機錯誤。但是,整個物種的ROM—個別ROM的集合—可以寫入有利於生存、繁殖的新指令。個體的存活、繁殖不是隨機的事件,因此每個世代繁殖成功的個體都無異在物種基因庫中寫入了改良的存活指令。物種演化,主要是指世代間(同一地址)不同基因版本的比例變化。當然,在每個特定時間點上,每個基因版本都存在於個體的身體裡。可是就演化而言,重要的是每個基因地址的不同基因版本「在族群中」的分佈。地址系統一直沒變,但是族群中不同基因版本的分佈,在幾世紀中會發生變化。

地址系統也會變,但那可是千載難逢的機緣。黑猩猩有24對染色體,我們有23對。事實上非洲的三種大猿都有24對染色體。我們與黑猩猩源自一個共同祖先,因此在過去某個時候,我們的祖系染色體數目發生了變化:原先的兩個染色體合併成一個。換言之,過去至少有一個人,體內的染色體數目與父母的不同。在整個基因系統中,還可能發生其他的變化。我們下面就要討論,染色體上一整段DNA偶爾會複製到不同的染色體上。我們知道這類事件發生過,因為在不同的染色體上,我們發現了完全相同的長串DNA鹼基序列。

一旦計算機從內存某個地址中讀取了信息,這份信息的命運可能有二:一是被寫到其他地方去,二是成為某個「動作」的一個成分。「寫入其他地方」的意思,就是「複製」。我們知道DNA很容易從一個細胞複製到新細胞中,而且大段大段的DNA也可以從一個人複製到另一個人體內,就是他的孩子。「動作」就比較複雜了。在計算機中,有一類動作就是執行程序指令。在我計算機的ROM(只讀存儲器)中,地址64489、64490、64491的內容合併起來,形成的特定(0與1)模式可以解釋成指令,使計算機的小喇叭發出一聲「嗶!」,那一信息模式是101011010011000011000000。那個信息模式,與「嗶!」或噪音沒有什麼內蘊的關聯。那個模式對揚聲器的影響(使它發出特定的聲音),表面看不出來。那個模式的效果完全是計算機組裝方式設定的。同樣的,DNA上以四個字母組成的「代碼」(基因),與功能—例如影響眼睛(虹膜)的顏色,或行為—也沒有什麼一眼就能看出的關聯。它們的影響,是由胚胎其他部分的發育模式決定的,而那個發育模式又是由DNA上其他基因模式控制的。本書第七章的主題就是基因間的互動。

DNA上的基因,在涉入任何一種行動之前,都得翻譯到另一個媒體上。首先,DNA上的基因得譯成RNA,一個字母都不能差。RNA也以四個字母構成。從RNA再翻譯成另一種不同的聚合體,就是多肽或蛋白質。它也許可以叫作氨基酸聚合體,因為它以氨基酸為基本單位。生物細胞中共有20種氨基酸。所有生物體內的蛋白質都是由這20種氨基酸組成的長鏈。雖然蛋白質是氨基酸聚合成的長鏈,大多數蛋白質都不是長條形的。蛋白質每條鏈都盤纏成一個複雜的結,結的形狀由氨基酸順序決定。因此氨基酸順序相同的蛋白質長鏈,會盤纏成相同形狀的結,不容變異。氨基酸的順序是由DNA上的鹼基序列(經由RNA)決定的。因此,蛋白質的三向度(空間)盤纏形狀,可說是由DNA上的單向度信息(鹼基序列)決定的。

翻譯程序包括著名的「基因碼」(genetic codes,舊譯「遺傳密碼」)。這是一本字典,DNA上每三個字母,最後都可以譯成一個氨基酸代碼,或「停止讀取」符號。四個基本字母可以組成64個「三字母」碼,對應20個氨基酸綽綽有餘。至於「停止讀取」符號,共有3個。許多氨基酸有好幾個「三字母」碼對應—我想你一定猜得到,因為氨基酸只有20種,而代碼有64個。整個翻譯工作,從單維的DNA只讀存儲器(ROM)到精確的蛋白質三維結構,是數字信息技術的絕活兒。至於基因影響身體的循序步驟,就不容易以計算機模型來說明了。

每一個活細胞,即使只是一個細菌,都可以想像成一個巨大的化學工廠。基因(DNA上的字母模式)的功能,表現在對工廠中事件、流程的影響上;它們有這種影響力,關鍵在它們支配了蛋白質的三維結構。我使用的形容詞「巨大的」可能會令你覺得驚訝,尤其是細菌的尺度以一微米為單位,一微米只有百萬分之一米。但是你一定記得每個細胞都能裝下整部《新約》的純文本檔,此外,說它「巨大」,從它包含大量的精密機器這個事實來說,也絕不誇張。每一台機器都是一個大型蛋白質分子,是在DNA上某一特定段落(基因)的影響之下組裝的。有一群蛋白質分子,學者叫作「酶」的,我認為都是機器,意思是:每一個酶都能促發一個特定的化學反應。每一種蛋白質機器都會生產特定化學產品。它們利用漂蕩在細胞中的分子當原料,那些分子很可能是其他蛋白質機器的產品。你想知道這些蛋白質機器的大小嗎?每一個大約由6000個原子組成。就分子而言,算是相當大了。每一個細胞裡約有100萬個這類大型分子機器,可區別為2000種,每一種都在化學工廠(細胞)中擔負專門的任務。這些酶特有的化學產品,是細胞分化的基礎,無論形狀還是功能。

所有身體細胞都有同樣的基因,可是身體細胞之間卻發展出很大的差異,這也許令人覺得驚訝。原因是:每個細胞雖然都有完整的基因組,可是為了維持生存、發揮功能,只需「讀取」其中一小組基因就成了,其他的基因就「存而不論」了;而不同種類的細胞,讀取的基因不同。在肝細胞中,DNA的只讀存儲器(ROM)中有關建造腎細胞的特殊指令就不讀了,反之亦然。細胞的形狀與行為,由細胞讀取的基因與從基因譯成的蛋白質產物而定。而細胞會讀取哪些基因,又受細胞中已有化學物的調控。那些化學物一方面源自細胞先前讀過的基因,另一方面又與鄰近細胞有關。細胞分裂時,兩個子細胞不一定相同。例如原來的受精卵中,某些化學物聚集在細胞的一端,其他的在另一端。這麼一個「兩極化」的細胞分裂後,兩個子細胞接收的化學物組成不同。也就是說,兩個子細胞會讀取不同的基因,就這樣,源自細胞內部的因素就能推動細胞分化的過程。整個生物體最後的形狀、四肢的大小、大腦神經線路的鋪設、行為模式的發生順序,都是不同種類的細胞互動的間接結果,而細胞不同,是因為讀取的基因不同。這些分化過程,最好以第三章討論過的「遞歸」程序來理解,而不是什麼中央控制中樞根據某個偉大藍圖排演出來的。在遞歸程序中,局部要素都能自主。

遺傳學家提到「基因的表現效應」時,討論的就是本章所謂的基因「行動」。DNA對身體、眼睛顏色(瞳孔四周的虹膜顏色)、頭髮的蜷曲程度、侵略行為的強度,還有其他幾千種觀察得到的特徵,都有影響,都叫作基因的表現效應。 DNA起先只在局部施展這些效應,一旦被RNA讀取了,翻譯成蛋白質,那些蛋白質就會影響細胞的形狀與行為。DNA模式中蘊含的信息,有兩種讀取的方式,這是其中一種。另一種就是複製新的DNA鏈,我們先前討論過。

這兩種傳遞DNA信息的方式,根本就不同,一是垂直傳遞,一是橫向傳遞。垂直傳遞是傳遞到其他細胞的DNA,那些細胞能製造其他細胞,最後製造精子或卵子。因此,DNA信息垂直傳遞到下一個世代,然後再垂直傳遞到無數的未來世代。我管這種DNA叫作「檔案DNA」。它們有不朽的潛力。傳遞「檔案DNA」的細胞系列,叫作生殖系(germ line)。每個身體裡都有一套細胞,最後會衍生出精子或卵子,因此就是未來世代的祖先,那套細胞就是生殖系。DNA的信息也能橫向傳遞:傳給生殖系以外細胞的DNA,例如肝細胞或皮膚細胞;在這些細胞中再傳給RNA,然後是蛋白質,以及各種對於胚胎發育的影響,因而影響成體的形狀與行為。你可以將橫向傳遞與垂直傳遞對應於第三章談過的兩個子程序,發育與生殖。

自然選擇就是不同DNA競爭垂直傳遞管道的結果,當然,不同的DNA進入物種「檔案DNA」的成功率並不相同。任何一個DNA的競爭對手,就是在物種染色體特定地址上註冊了不同信息的DNA。有些基因比對手基因更成功地留在物種檔案中(物種ROM)。「成功」的終極意義是留在物種檔案中,成功的判斷標準通常是基因通過橫向管道對於身體的「行動」。這也與計算機裡的生物形模型很相似。舉個例來說吧。假定老虎有一個特定基因,通過橫向管道影響了上下顎的細胞,使牙齒變得不怎麼銳利,可是這個基因的對手基因,卻會使牙齒變得更尖利。老虎的牙齒要是特別尖利,就能更利落地殺死獵物;因此就會有更多的子女;因此就能垂直傳遞更多「利齒」基因的復本。這頭老虎同時也傳遞了其他的基因,不錯,但是平均而言,擁有利齒的老虎體內才有利齒基因。就垂直傳遞而言,這個基因得益於它對各種身體的平均影響力。

DNA作為檔案媒體,表現非凡。它保存信息的能力,遠勝石板。乳牛與豌豆(以及我們人類)都有一個幾乎一樣的組蛋白H4基因。它在DNA上,由306個字碼組成。我們不能說它在所有物種中都登記在同一個地址下,因為我們無法有意義地比較物種之間的地址卷標。我們能說的是:乳牛DNA上有一串字碼,共306個,豌豆DNA上也有這一串306個字碼,幾乎完全一樣。兩者只差兩個字母。我們不知道乳牛與豌豆的共同祖先究竟生活在什麼時候,但是化石證據顯示:那必然在10億到20億年前。就說15億年前吧。以我們人類來說,15億年可真難以想像,在那麼悠長的歲月中,從那位遠古共同祖先分化出來的兩個生物世系,居然將原始信息中的306個字碼保存了305個(這是平均數:也許一個世系保存了所有306個字碼,另一個世系保存了304個)。刻在墓碑上的字母,不過幾百年就難以卒讀了。

組蛋白H4這份DNA文件還有一個特徵,與石板不同,因此信息能夠忠實保存下來更令人覺得不可思議,那就是:它並不是因為材質耐久,所以登錄的信息能完整保存。這份文件一代又一代地反覆複製過,就像古代的希伯來經典,每80年就由抄手(書記)隆重地謄錄一通,免得抄本耗損、字跡漫漶。從豌豆與乳牛的共同祖先,一直傳到今天的乳牛身上,這份組蛋白H4文件不知謄錄過多少次了,實際的次數說不準,但是可能經過200億次連續謄錄,應是合理的推測。經過200億次連續謄錄仍能準確地保存信息內容的99%,這實在難以找到適當的標尺來打分數。我們可以試著用一種傳遞遊戲來當標尺。請想像:有200億個打字員坐成一排,這一排可以環繞地球500圈。第一個打字員打出一頁文件,然後傳給鄰座的打字員。他重打一遍,再將打出的復本傳給下一個打字員。他重打一遍,將打出的復本再傳給下一個打字員。如此這般,一直到復本傳到最後一位打字員手裡。好了,讓我們讀讀這份文件(或者說,這第200億位打字員讀這份文件)。你猜這份文件與原始文件會有何差別?

為了回答這個問題,我們得對打字員的出錯率做些假定。讓我們將這個問題扭轉過來。每個打字員必須多麼仔細,才比得上DNA的表現?答案幾乎可說太過荒謬,不值一提。一萬億分之一!連續打一萬億個字母,只准錯一個。換言之,整本《聖經》一次謄錄25萬個復本,只准錯一個字母。現在的秘書,每頁只出一個錯就算不錯了。算來組蛋白H4基因的出錯率必須放大5億倍才比得上。一排秘書輾轉抄錄這份以306個字母寫成的文件,到第20名,這份文件只保存了原始文件的99%。到了第10000名秘書的手上,原始文件中的信息只剩下1%。別忘了,整排秘書共有200億位,這時還有99.9995%沒見到複寫本呢。

我承認,這個比較多少有點兒詐欺的成分,但是有趣的也在這裡,而且這個面相頗富玄機,值得討論。我的討論讓人產生的印象是:我們想測量的是複製過程中的出錯率。但是組蛋白H4文件不只要複製,還必須受自然選擇考驗。組蛋白關係生物體的生存,極為重要。染色體的結構工程就要用到組蛋白。也許組蛋白H4基因在複製過程中出過許多錯,但是帶有組蛋白H4突變基因的個體都無法存活,或者至少無法繁殖。為了讓比較公平些,我們應該在我們的想像實驗中加上些條件,例如每個打字員的打字機與一把槍聯機,只要打字員一出錯,扳機就會扣動,無異找死。下一名打字員就自動遞補上來。(要是讀者覺得槍斃太殘酷了,也許可以想像打字員坐在彈射椅上,只要一出錯,就給彈射出去,但是槍斃比較符合自然選擇運作的邏輯。)

你看出來了吧,前面測量DNA恆定性的方法,就是檢查特定DNA片段(基因)在地質時間中的變化量,其實混淆了真正的複製忠實度與自然選擇的過濾效果。我們只能觀察到成功的DNA變異(突變)。導致死亡的突變我們觀察不到。我們能夠測量到真實的複製忠實度嗎?就是每一世代自然選擇開始運行之前的情況。可以。取所謂突變率的倒數就成了,突變率是可以測量的。結果,在任何一個複製DNA的事例中,任何一個字母複製錯誤(點突變)的概率略高於十億分之一。組蛋白H4基因在演化過程中實際發生的突變遠低於這個數字,反映的是自然選擇保存這份古代文件的效能。

以基因的標準來說,組蛋白H4基因經得起十數億年歲月的消磨,是個例外,而非常態。其他的基因變化率就高了,想來自然選擇對於它們的變異較能容忍。舉個例子好了,血纖維蛋白肽(fibrinopeptides,在凝血過程中形成的蛋白質)在演化中的變化率與基本突變率相去不遠。這也許表示血纖維蛋白肽的結構即使出了什麼差錯也不是性命交關的事。血紅蛋白基因的變化率則介於組蛋白與血纖維蛋白肽之間。血紅蛋白在血液中執行重要的任務,它的結構的確重要;但是幾種不同的版本似乎都能圓滿達成任務。

這兒我們碰上了一個似乎難以自圓其說的現象,我們得好好想想才能脫困。演化速率最慢的分子,例如組蛋白,正是受到自然選擇嚴密監控的分子。血纖維蛋白肽演化的速率非常高,只因自然選擇並不在乎。它們能變就變了,所以演化速率接近自然突變率。我們覺得兩者似乎格格不入,只因為我們太過強調「自然選擇是演化的驅動力量」。因此,我們會覺得要是沒有自然選擇,就沒有演化了。反過來說,強大的自然選擇壓力也許會導致快速的演化。這樣想其實頗合理。可是我們卻發現自然選擇施展的卻是踩剎車的力量。要是沒有了自然選擇,演化的基礎速率,就是最大的可能速率。而所謂演化的基礎速率,與突變率是同義詞。

這一點都不難以解釋。只要我們仔細思量,就會覺悟那是理所當然的。以自然選擇為機制的演化,不可能快過突變率,因為說到底,突變是唯一創造種內變異的方式。自然選擇所能做的,是接受某些新的變異,排斥其他的變異。突變率必然是演化率的上限。實際上,自然選擇所關心的大部分是防止「演化變化」(簡稱「演化」)發生,而不是驅動演化。不過我得在這兒加上一句,我的意思並不是自然選擇只是個毀滅的過程。自然選擇也能創造,我會在第七章解釋。

可是突變率的確很低。換言之,即使沒有自然選擇,精確保存檔案的表現都令人印象極為深刻。保守一點估計,即使沒有自然選擇,DNA都能精確地複製,大約500萬個複製世代才會「抄錯」1%個字母。在我們的思想實驗中,打字員的表現比起DNA來,實在望塵莫及,即使沒有自然選擇。想達到DNA的基礎水平(沒有自然選擇的情況),每個打字員都必須打一遍《新約》只錯一個字母。也就是說,就打字的本領而言,他們必須比典型的秘書好上450倍。用不著說,這個數字比起「5億倍」讓人覺得踏實多了,但仍然令人肅然起敬(前面說過,在自然選擇監控之下,組蛋白基因的複製出錯率,相當於謄錄整部《聖經》25萬次,只錯一個字母)。

但是我對打字員並不公平。我等於假定他們無法察覺自己犯的錯誤,並改正過來。我假定完全沒有「校對」的這回事。在實務上,他們當然會校對。因此,我這排數以億計的打字員,不會讓文件的原始文本像我說的那麼容易失真。DNA的複製機制會自動進行同樣的偵錯/除錯工作。要是它不做校對,就不會達成我報道過的複製正確率,那可是個驚人的成就。DNA的複製程序包含了各種校對步驟。由於DNA碼的字母不像刻在大理石上的象形文字,不是靜態的,校對更為重要。DNA上的「字母」分子非常小(記得我用過的比喻嗎?一本DNA《新約》一根大頭針的頭頂都放得下),因此不斷地受到衝擊—分子受熱後變得不安分,相互推擠是十分尋常的事。DNA分子本身也在不斷變動,好比信息中的字母不斷更新。每一個人類細胞中,每天有5000個DNA「字母」退化,必須以修補機制立即補上。要不是修補機制隨時工作、不停工作,細胞核中的遺傳信息就會逐漸消散掉。校對剛複製出的文本只是正常修補工作的特例罷了。DNA儲存信息既精確又忠實,主要就靠校對機制。

我們已經知道:DNA分子是一種神妙的信息技術的核心。它能將龐大而精確的數字信息收錄在極小的空間中;它又能將這份信息保存很長一段時間,單位以百萬年計,雖然不可能不出錯,可是出錯率低得驚人。這些事實會領我們到什麼地方去?它們指引我們方向,朝向地球生命的核心真理。本章一開始我談到柳絮、種仁,就在暗示那個真理:生物是為了DNA的利益而活,而不是顛倒過來。這可不是不言自明的真理,但是我希望能夠說服你。DNA分子上的信息,要是以個體生命史的尺度來衡量,幾乎可算不朽。DNA信息(加減一些突變)的生命史是以百萬年到億年為單位來衡量的;或者,換句話說,相當於1萬個個體到1萬億個個體的生命史。每個生物個體都應視為暫時的傳播媒介,DNA信息在漫長的生命史中,不過以生物體為逆旅罷了。

世上充滿了存有物!沒錯,我沒有異議,但是這樣說不能幫助我們釐清問題。東西存在,要麼因為它們最近才出現,要麼它們擁有一些特質,使它們在過去不可能被摧毀。岩石不會很快形成,一旦出現了,就堅硬得很,經得起歲月摧折。不然,就不是岩石了,而是沙。也真是,有些岩石變成了沙,所以海濱才有沙灘。耐久的才會以岩石之姿存在世上。另一方面,露珠存在世上,不是因為它們耐久,只因為它們剛形成,還沒時間蒸發。我們似乎有兩種「存有性」(existenceworthiness):露珠類,簡言之就是「可能出現但不會持久」;以及岩石類,「不容易出現,一旦出現了,就可能持續一段時間」。岩石有耐久性,露珠「易於問世」(generatability)。

DNA則左右逢源。DNA分子作為一種實體存有物,就像露珠。在適當的條件下,它們很快就會出現,但是它們不能長期存在世上,幾個月內就會被摧毀。DNA分子不像岩石那樣耐久。但是它們身上的字母「模式」卻像最堅硬的岩石一樣耐久。它們有本事存在幾百萬年之久,因此它們現在仍然存在。DNA與露珠最根本的不同是:新的露珠不是由老的露珠生產的。露珠與露珠都很相似,毫無疑問,但是它們不會特別像「親代」露珠。露珠與DNA分子不同,不會形成世系,因此不傳遞信息。露珠是自然發生的,DNA信息必須複製。

「世上充滿了東西,個個都有在世上混的本錢!」這樣的說辭不僅是廢話,而且無關痛癢,幾乎可笑,除非我們將這種說辭應用到一種特殊的耐久性上—以大量復本、世系表現的耐久性。DNA信息的耐久性與岩石的不同,它們易於問世,但與露珠不同。就DNA分子而言,說它們「有在世上混的本錢」可不是泛泛之談,也不是廢話。原來DNA分子在世上混的本錢,包括建造像你、我一樣的「機器」,那可是已知宇宙中最複雜的東西了。這怎麼可能呢?

基本上,理由是:DNA的性質正是任何累積選擇過程必要的基本要素。第三章的電腦模型中,我們有意地將累積選擇的基本要素設計進去。如果累積選擇真的會在世上發生,就必須有某些實體,而且它們的性質構成那些基本要素。現在讓我們看看那些要素究竟是什麼。我們必須記住一個事實:這些要素必然早已在地球上自然出現了,至少是以某種粗陋的形式存在著,否則累積演化,以及生命,絕不可能發生。我們正在談的,不一定只涉及DNA,而是生命在宇宙中任何地方出現都必需的基本要素。

當年,猶太人先知以西結被上帝的靈帶到堆滿骸骨的山谷中。他遵從上帝的命令,向骸骨發預言,使枯骨連接起來,生筋長肉。但是那些軀體仍然沒有生氣。它們還缺生命要素。一顆沒有生物的行星上,有原子、分子、大塊物質,隨機地互相推擠、依偎,服從的是物理定律。有時物理定律使原子、分子結合在一起,就像以西結的枯骨,有時物理定律使它們分裂、分離。原子有時會形成相當大的集結體,然後瓦解、分崩。但是它們裡面仍然沒有生氣。

以西結召喚四方之風將生氣吹入枯骨形成的軀體中。像早期地球一樣的死行星(沒有生物的行星),必許具備哪些生機,才有機會成為活行星?不是生氣,不是風,也不是任何仙丹、妙藥。根本不是任何實體,而是一種性質,就是自我複製的性質。這是累積選擇的基本要素。必須出現能夠複製自己的實體,我叫它們「複製子」(replicators)。至於它們怎麼出現的,細節仍不清楚,但它們是在尋常的物理定律支配下出現的,而不是奇跡,殆無疑義。在現代生物中,這個角色幾乎完全由DNA扮演,但是任何能複製自己的東西都能勝任這個角色。我們猜測原始地球上的第一個複製子也許不是DNA分子。功能完全的DNA分子不大可能一下子就出現了,通常它得有其他分子的協助才成,而那些分子通常只有生物細胞中才有。最早的複製子也許比DNA粗陋而簡單。

另外還有兩個基本要素,通常只要第一個(自我複製)有了,就會自動出現。在複製自己的過程中,必然偶爾會出錯;即使DNA系統不常出錯,也是會出錯的,地球上第一個複製子就更容易出錯了。此外,至少有些複製子有「力量」(power)影響自己的前途。這最後一個要素,聽來比實際上要邪惡。我的意思不過是:複製子的某些性質應會影響它們被複製的概率。這很可能是自我複製的基本事實導致的必然結果,至少會以簡陋的形式表現出來。

於是每個複製子都製造了好幾個自己的復本。每個復本都與原版相同,擁有原版的性質。當然,這些性質包括「製作更多自己的復本」(復本難免偶爾會夾帶錯誤)。因此,每個複製子都有潛力成為一個世系的始祖,子孫複製子瓜瓞綿綿。每個新的復本必然都是以原料建造的,就是四周遊蕩的小建材。想來複製子可以當作某種模型或模板。小建材在模型裡組裝在一起,於是另一個模型就產生了。然後復本脫離模型,自身成為複製另一個復本的模型。因此一個有增殖潛力的複製子族群就形成了。族群不會無限成長下去,因為原料的供應是有限的。

現在我們要討論我們論證的第二個要素。有時候複製並不完美。錯誤會發生。任何複製過程都無法完全消弭出錯的可能,只能降低發生的概率。這是高級音響製造商一直在努力的事,而DNA複製過程在降低出錯率方面,表現亮麗、非凡,我們已經談過了。但是現代生物的DNA複製機制是個高級技術,包括精密的校對技術,經過許多世代的累積選擇,已達成熟的境地。前面說過了,最早的複製子複製本領可能稀鬆平常多了,以忠實度而言,當然比不上今日的後出轉精。

現在回頭來看那群遠古的複製子族群,瞧瞧複製失誤會產生什麼後果。用不著說,那不是個由相同的複製子組成的單調族群,其中有變異。複製失誤的後果,也許就是喪失自我複製的能力。但是有些失真的復本仍能自我複製,只是與親代在其他方面有些不同。於是那些帶有錯誤的復本就在族群中繁衍了。

這兒使用「錯誤」(或「失誤」)這個詞,你千萬別誤會,得抹殺它的所有「貶義」。它是相對於高度忠實的復本而言的。複製錯誤搞不好能產生正面的結果,存活或複製本事反倒提升了,誰知道呢。我敢說許多精緻的美食都是意外創造的,原來廚師只想遵循食譜炮製一番,哪知出了岔,新奇的美食因而誕生。要說有什麼科學點子是我首創的,有時不過是誤解或誤讀別人的點子罷了。回到太古複製子吧。大多數複製錯誤也許會降低複製效率,甚至使複製機制死機,但是少數錯誤反而能提升複製效能,於是帶有這種複製「缺陷」的子代成為更好的複製子,親代「原版」比不上。

「更好」是什麼意思?基本上,指的是複製效率更好,但是實務上呢?說到這兒,就得談第三個要素了。我說過,它就是「力量」,你很快就會瞭解我的理由。我以「小建材在模型裡組裝」討論過複製過程,我說過整個過程的最後一步就是復本脫離模型,成為複製下一個復本的模型。可是「脫離」的時刻「舊模子」的性質也許會有影響,例如一種我叫作「黏度」的性質。假定在太古的複製子族群中,由於過去累積的複製錯誤,已經有好些不同的變異品種,其中有些品種正巧比較黏—復本不易脫離。最黏的,復本平均要花一小時才能脫離,去幹自己的複製事業。比較不黏的,複製完成後,不要一秒鐘復本就脫離了,可以立即製造下一個復本。最後哪個品種會在族群中佔優勢?答案不言而喻。如果這是那兩個品種的唯一差異,比較黏的那個注定成為族群中的少數。不黏的品種製造復本的速率,比較黏的品種瞠乎其後,望塵莫及。中間黏度的品種,則速率平平。於是一個朝向低黏度的「演化潮流」就形成了。

這種基本的自然選擇過程科學家已經在試管中觀察到了類似的例子。有一種叫作Q-beta的病毒,寄生在大腸菌中。Q-beta沒有DNA,但是有一條相關的RNA分子,事實上Q-beta主要就是一個RNA分子構成的。RNA也能像DNA一樣地複製。

在正常細胞中,蛋白質分子是根據RNA「模板」組裝出來的,不同的RNA「模板」組裝出不同的蛋白質。而RNA「模板」是從保存在細胞檔案室中的DNA主板翻製出來的。但是理論上,建造一個特別的機器(和其他的細胞內機器一樣,也是一個蛋白質分子),以RNA「模板」翻制更多RNA「模板」是可能的。RNA複製酶就是這樣的機器。在細菌細胞內這樣的機器通常毫無用處,細菌根本不會建造它。但是由於複製酶是個蛋白質,就像其他蛋白質一樣,細菌細胞中建造蛋白質的機器多才多藝,很容易轉而製造複製酶,就像汽車工廠中的機器工具,在戰時很快就能徵用來製造軍火:只要給它們正確的藍圖就成了。這正是Q-beta幹的事。

那個病毒幹活兒的零件是一個RNA「模板」。表面上,它與細菌細胞中遊蕩的其他RNA「模板」沒什麼差別,那些模板是從細菌DNA翻製出來的。但是,要是你仔細閱讀那個病毒RNA中的文本,就會發現其中包藏禍心:那是一份製造RNA複製酶的計劃。別忘了,RNA複製酶是製造RNA「模板」的機器,因此那個病毒RNA就能大量複製了,數量以指數成長。

於是細菌的生命工廠就被這些自利的藍圖劫持了。我們甚至可以說,它是咎由自取。要是你在工廠裡設置的機器儘是些多才多藝的,給它們任何藍圖都能順利製造出產品來,那麼遲早會出現一張藍圖,讓那些機器製造那藍圖的復本。於是這些惡棍機器在工廠裡越來越多,到處都是,每個都吐出惡棍藍圖,製造複製自己的機器。最後,這個不幸的細菌撐不住了,裂開了,釋放出數以百萬計的病毒,侵入其他的細菌。這就是病毒在自然中的生命循環。

我把RNA複製酶叫作機器,RNA(模板)叫作藍圖,是有理由的,我會在另一章討論。但是RNA複製酶與RNA也都是分子,化學家可以將它們從生物體內抽出、純化,裝入瓶子,儲存在實驗室的試劑架上。這正是美國哥倫比亞大學的分子生物學家施皮格爾曼(Sol Spiegelman,1914~1983)與同事在20世紀60年代做的事。然後他們將這兩種分子一起放入試管溶液中,結果發生了有趣的事。在試管中,RNA分子就像個模板,專門合成自己的復本,但是這個過程必須有RNA複製酶的協助才能進行。先是,機器工具與藍圖分別被取出、隔離儲存。然後,讓它們在水中接近,並供應必要的小分子原料。雖然這時它們是在一個試管中,而不是在活細胞中,兩者都恢復了過去的老把式。

從這個實驗再跨出一小步,就能在實驗室中觀察自然選擇與演化了。這只不過是(電腦)「生物形」模型的化學版。基本上,實驗是這麼做的:取一排試管,每一根都注入RNA複製酶溶液,以及合成RNA需要的小分子。每根試管都有機器工具與原料,但是啥事也沒發生,因為缺了藍圖。現在將微量RNA倒入第一根試管。複製酶(機器工具)立即開始工作,製造出許多剛加入的RNA分子的復本,那些RNA分子在試管溶液的每個角落都可以發現。現在從這根試管取出一滴溶液,滴入第二根試管中。同樣的過程也在第二根試管中上演了,然後從第二根試管取出一滴溶液當種子,「種入」第三根試管,再下一根試管,如此這般,直到最後一根試管。

偶爾,由於隨機的複製失誤,試管中會出現稍微不同的(突變的)RNA分子。要是變異的RNA分子(突變種)比原先的優異,很快就會在試管中占數量的優勢(這裡不討論「優異」的緣由,純以觀察到的複製效率做判斷標準)。不用說,試管取出的「種子」溶液,也是變異RNA佔優勢。因此下一個試管中,原先的RNA與變異RNA都是種子。從出現變異RNA的試管起,檢驗一系列試管(「世代」),觀察到的現象就是不折不扣的「演化變化」(簡稱「演化」)。從許多回實驗的最後一根試管,搜集到最具競爭優勢的變異RNA,裝瓶、貼標籤後可供日後使用。舉個例子好了,有個變異RNA叫作V2,比正常的Q-beta RNA複製效率高很多,也許是因為它比較小。V2與Q-beta不同,它不必攜帶製造複製酶的藍圖。複製酶是由實驗者免費供應的。美國加州薩克研究所(Salk Institute)的奧格爾(Leslie Orgel,1927~2007;英國人,1951年獲得牛津大學博士學位)以V2做過一個有趣的實驗。他的團隊為它設計了一個艱困的環境。

他們在試管中加入了溴化乙錠,那是一種毒性試劑,能抑制RNA的合成,就是使機器工具(複製酶)出現故障。一開始,奧格爾使用的毒液非常稀薄。最初幾根試管中,毒劑使RNA合成的速率降低了,但是經過9根試管的移轉之後,經得起毒劑荼毒的RNA新品種就脫穎而出了(給「選擇」出來了)。變異RNA的合成率,相當於正常V2 RNA在沒有毒劑的試管中。然後奧格爾的團隊將毒劑加重一倍。RNA合成的速率再度降低,但是經過10根(以上)試管的移轉之後,經得起高劑量毒劑荼毒的新品種又演化出來了。然後,毒劑再加重一倍。就這樣,以逐步加倍毒劑的程序,他們想演化出即使在極高濃度的溴化乙錠溶液中仍能複製的RNA品種。結果RNA V40演化出來了,它在10倍濃度的毒液中仍能複製—那是以抑制「祖先」種(V2 RNA)複製的濃度為計算基準的。從V2演化成V40,要經過100根試管的轉移(100個「世代」;當然,在真實世界中,每一次試管轉移都對應許多RNA複製世代,而不只是兩個)。

奧格爾的實驗並未動用複製酶。他發現RNA分子在這些條件下能夠自動地自我複製,只不過速率很慢。它們似乎需要其他的催化物質,例如鋅。這個發現非常重要,因為在生命史的初期,複製子剛出現的時候,可能還沒有協助它們複製的酶。鋅倒可能有。

1976年,德國馬克斯·普朗克生物物理化學研究所做了一個實驗,與奧格爾的實驗互補。在生命起源的研究上,那是個影響力很大的研究機構,由1967年諾貝爾化學獎得主艾根(Manfred Eigen,1927~ )領導。艾根的團隊在試管中放入複製酶與製造RNA分子所需的原料分子,但是不在溶液中播種(RNA分子)。然而,一個特別的RNA大分子自然地演化出來了,而且在以後的獨立實驗中,同樣的分子一再地演化出來!會不會是試管無意中被RNA分子「污染」了?仔細檢查後,這個可能被排除了。這實在是不得了的結果:同樣的大分子自動地演化了兩次?概率太低了!這比猴子在計算機鍵盤上隨意敲出哈姆雷特的一句話還不可能(還記得嗎?我們在第三章討論過)。那個特別的RNA分子,就像那句話在我們的計算機模型中演化一樣,是逐步、累積演化組裝成的。

反覆在這些實驗中產生的那個RNA分子,與施皮格爾曼製造出的,大小相同,結構也相同。只不過施皮格爾曼的RNA分子是從自然界的Q-beta RNA「變化」出來的,艾根的卻幾乎可說是「無中生有」演化出來的。這張藍圖特別適應加了複製酶的試管環境。因此從兩個非常不同的起點出發,通過累積演化,抵達同一終點,可說是由環境選擇的。大型的Q-beta RNA分子不太適應試管環境,卻非常適應大腸菌的環境。

這樣的實驗幫助我們瞭解自然選擇具有自動、非蓄意的性質。複製酶「機器」不「知道」它們幹嗎要製造RNA分子:它們那麼做,只不過是它們的形狀作祟,並非蓄意。RNA分子也沒有籌劃自我複製的策略。即使它們能思考,我們也得解釋會思考的實體為何會有自我複製的動機。就算我知道複製自己的方法,我也拿不準我會在生涯規劃中將複製自己列為優先事項,幹嗎呀?!可是分子說不上動機。那個病毒RNA的結構只不過剛巧發動了細菌細胞中的機關,於是它的復本就源源不斷的生產出來了。任何實體,不管在宇宙中的任何角落,要是剛巧具有複製自己的絕佳本事,那個實體的復本就一定會源源不斷地現身,完全自動。還有呢,由於它們自動形成世系,又偶爾會出錯,於是在累進演化強有力的指引下,新版本的複製本領往往青出於藍,後來居上。這個發展道理極為簡單,過程又是自動的,一切都在預料之中,簡直就不可避免。

在試管中,一個「成功的」RNA分子,關鍵在它有某種直接、內在的性質,可與我假設例子中的「黏度」比擬。但是「黏度」之類的性質並不引人入勝,只不過是複製子的基本性質罷了—直接影響複製利益的性質。複製子還可能影響其他的事物,那些事物對其他事物有影響,那些事物又影響到其他事物,最後間接影響到複製子複製自己的機會。你可以看出,要是像前面說的因果長鏈果真存在,我們反覆說過的基本原理仍然站得住。複製子只要有複製自己的本事,就會在世上佔優勢,無論它的複製利益受多長的因果鏈影響,因果關係多麼間接,都不會改變這個原理。同理,世界會被這因果鏈上的環節佔據。我們會討論那些環節,並對它們大為驚奇。

在現代生物中,我們隨時都能看見它們,就是眼睛、皮膚、骨骼、腳趾、大腦、本能。這些事物是複製DNA的工具。它們是DNA造成的;眼睛、皮膚、骨骼、本能等彼此不同,也是DNA的不同造成的。導致它們的DNA,複製的概率受它們的影響,因為它們影響身體的生存與繁殖—身體包含同樣的DNA,因此身體與DNA同舟一命。因此,DNA通過身體的特質,影響自己的複製。我們可說DNA有影響自己前途的力量,身體、器官、行為模式則是那個力量的工具。

說到力量,我們說的是後果,能夠影響自身前途的複製子產生的後果,不管那些後果是多麼的間接。從因到果的鏈子由多少環節組成並不重要。如果「因」是一個能複製自己的實體,「果」不管多遙遠、多間接,都受自然選擇的監視。我要借一個河狸的故事,來勾勒這個原理。故事的細節多是臆測之詞,但大體上不會太離譜。雖然沒有人研究過河狸大腦神經線路的發育,科學家研究過其他動物的,例如線蟲。我從那些研究摘取結論,應用到河狸身上,因為對許多人來說,河狸比較有趣、宜人。

河狸的一個突變基因,只不過是一個字母的改變,而完整的基因組文本包含10億個字母;這個改變發生在基因G。隨著小河狸日漸發育長大,改變的字母也與文本中其他字母一起複製到所有細胞裡。大多數細胞中,基因G不會被讀出來;其他的基因,只要涉及其他細胞類型的運轉,就會讀出。不過,發育中的大腦有些細胞會讀出基因G。它被讀出後,就轉譯成RNA。那些RNA工作復本在細胞裡四處遊蕩,最後有些撞上製造蛋白質的機器,核糖體。核糖體細讀RNA工作計劃,按規格生產新的蛋白質分子。每個蛋白質都有特定的氨基酸順序,因而折疊成特定的形狀。那些氨基酸順序是基因G的DNA鹼基序列決定的。基因G突變了之後,使原先的氨基酸序列發生了重大的變化,因此蛋白質分子的折疊形狀也改變了。

這些稍微改變了的蛋白質分子,在發育中的大腦細胞中由核糖體大量生產出來。它們是酶,就是在細胞中製造其他化合物(基因產物)的機器。基因G的產物會進入細胞膜,與細胞纖維有關,就是與其他細胞建立聯繫的管道。因為原先的DNA計劃發生了微小的改變,這些細胞膜化合物有一些生產率就改變了。因此某些發育中的腦細胞彼此相連的情形也改變了。河狸大腦某一部分的神經線路於是就發生了微妙的變化—DNA文本的一個變化導致的間接、遙遠的後果。

河狸大腦這一部分因其在整個神經網絡的位置,正巧與河狸的築壩行為有關。當然,不論河狸什麼時候築壩,都必須使用大部分大腦,但是基因G突變影響了大腦網絡的特定部分,因而對行為有一特定的影響。於是河狸在水中以嘴咬著圓木游泳時,會把頭抬得很高—相對於體內沒有突變基因G的個體而言。這使得圓木上沾的泥巴不大可能在運送途中被水沖走,圓木彼此的附著程度因而增加。這麼一來,河狸將圓木塞入水壩後,圓木比較不容易鬆動。凡是體內有這個突變基因的河狸,塞入水壩的圓木都不易鬆動。建造水壩的圓木比較緊密地附著在一起,是DNA文本的一個變化導致的後果—間接的後果。

圓木比較緊密地附著在一起,使水壩的結構更堅實,不容易被水沖垮。於是水壩攔住的湖水就增加了,湖中央的巢穴更為安全,不容易受獵食動物的侵襲。這麼一來河狸生養成功的子女數量就會增加。要是觀察整個河狸族群,那些帶有突變基因的個體平均說來生殖成功率較高。那些子女通常都從父母繼承了同一突變基因的檔案復本。因此,在族群中,這個基因的這一形式數量會隨著世代遞嬗而越來越多。最後它成為主流、正常形式,不能再以「突變型」指涉了。這時,河狸壩一般而言又改進了一級。

我承認這個故事只是個假說,細節也許不正確,但是那與我的論點無關。河狸壩的演化,受自然選擇的監控,因此真實的情況除了細節外,與我的故事不會有什麼出入。這個生命觀的大意,我在《延伸的表現型》(The Extended Phenotype,1982;1999)一書中解釋、演繹過,這兒就不重複了。你可能注意到:在這個虛擬故事裡,至少有11個因果環節將基因與改善了的生存(生殖)串聯在一起。在實際的例子中,涉及的環節也許更多。那些環節每一個都是由DNA上的一個變化造成的,無論是對細胞化學的影響,後來對大腦細胞鏈接模式的影響,再後來對行為的影響,或最後對水壩攔截的水量的影響。即使那些環節不止11個,而是111個,也無妨。基因的變化(突變),只要影響自我複製的概率,就會受自然選擇的篩揀。這道理實在太簡單了,過程是自動的、不待籌度的。只要累積選擇的基本要素—複製、失誤、力量—出現了,這樣的事(累積演化)是不可避免的。但是這如何發生?地球上,在生命出現之前,那些要素怎麼出現的?下一章,我們要討論如何回答這個困難的問題。