讀古今文學網 > 基因中的人類簡史 > 第十章 DNA碎片 >

第十章 DNA碎片

溫故而知新。

——孔子

1999年的冬天,凌晨兩點鐘,斯科特·伍德沃德家裡的電話鈴響了,他立刻跳起來去接電話,打電話的是一個老人,他問:「這是斯科特·伍德沃德的家嗎?」接著又問:「你瞭解DNA嗎?」斯科特·伍德沃德是楊百翰大學分子遺傳學的教授,家住猶他州,四個兒子都十幾歲了。那個打電話的人說他名叫詹姆斯·萊沃伊·索倫森,猶他州人,曾經去挪威探尋祖先,想瞭解一下他同自己的家族史有什麼關聯,但是進展不大。他打電話的目的是想知道伍德沃德能否把挪威所有人的DNA檢測並分析一下,如果可能,需要多少費用。

伍德沃德是一個比較悠閒的人,他說他得考慮一下,過幾個星期再給索倫森打電話。伍德沃德回到實驗室,費了很大勁才找來幾個同辦公室的人,告訴了他們索倫森的事,並且問道:「你們說這傢伙是認真的嗎?」這幾個人回答說:「聽說他淨干荒唐事。」據瞭解,這個索倫森是猶他州的首富,也是世界富豪榜上的常客。他開了32家不同行業的公司,持有60項個人專利,他這一輩子掙了十億多美元。人們普遍認為索倫森的項目往往涉及耗資巨大的發明,有時候還能賺取很大利潤。其中一個是他在20世紀50年代發明的一次性外科手術用口罩。

於是,伍德沃德開始考慮索倫森的請求。檢測挪威每個人的DNA需要多少費用呢?挪威有多少人口?怎樣才能收集到每個人的血樣?這得需要多少血樣?這些都是非常要緊的問題,但是對此事考慮得是否周全,伍德沃德心裡還是沒底。花費幾百萬美元去分析整個國家的DNA是一回事,確定這件事值不值得做又是另一回事。花費這麼多時間,僱用這麼多人力,索倫森提供的經費是不是發揮了最大的效用?這個工程除了滿足索倫森的請求以外,還能達到別的目的嗎?

當然了,所有的專業科學家都必須重視預算問題,因為用於科研的經費是有額度的。為了能夠有效地使用經費,他們必須證明自己能夠用經費取得最佳成果。即使科學家們對於經費資源不進行競爭,但是從本質上講,他們也必須小心謹慎地對待經費來源。從根本上講,所有成功的研究項目都必須少做實驗,多得成果。伍德沃德還沒有想清楚,獲得多少研究成果才能證明這樣大的項目是值得做的。

在伍德沃德估計項目費用的同時,他還要思考是否能達到他的第二個目的,這就是花費如此巨額的經費,除了要給這個性格古怪的億萬富翁一個滿意的結果外,還要為遺傳學做出超值的貢獻。然而,他認為這個工程還沒有萬事俱備,這樣大的研究項目所需的經費簡直就是天文數字。

兩個星期以後,伍德沃德來到索倫森的辦公室,索倫森問他給挪威人的基因進行遺傳分類需要多少錢,伍德沃德說:「這個,所需費用可能相當大,恐怕你負擔不起。」

「哦,是嗎?」索倫森說,「到底多少錢?」

「五億美元。」

索倫森聳了聳肩說:「我可以給。」

哇!伍德沃德想,我把價碼定得太低了!

近年來,有很多人意識到了DNA不尋常的潛力,科學家們致力於研究通過Y染色體來追尋去世多年的人的活動,並且越來越清楚地認識到,如果你能夠確切地解讀Y染色體,那麼任何群體的DNA都能開啟通往模糊不清的人類歷史的通道,讓人們更清楚地認識歷史。對於像索倫森那樣異常精明的人來說,DNA的微粒無處不在,就像是這個星球上的旅遊者一路旅行時灑下的麵包屑。

更使人震驚的是,通過DNA認祖歸宗還有一個根本性的作用,那就是通過DNA,你不但能夠走進久遠的世界歷史,還可以探尋你的DNA是從哪裡來的,出自哪些祖先。遺傳學不僅僅能夠使你縱覽歷史重大事件和知名人士的生活,還能給你個人繪製一幅家族歷史的畫面。

伍德沃德說,就索倫森的項目而言,分析每個挪威人基因組的成果是很有限的。項目可以讓人們更多地瞭解到挪威歷史,並且告訴索倫森他自己在歷史中的位置。但是同樣用這五億美元,他們不但能解答索倫森個人的問題,同時還能解答許多其他的問題。

因此,伍德沃德對項目提出了不同的建議:首先從全世界五百個不同的人口群體中各挑選兩百人進行基因組分析。這十萬人的基因組就構成了整個人類基因庫的縮影。這些DNA不但代表所有活著的人,還能代表已經離世的,特別是生活在幾百年前的人的大部分DNA.伍德沃德說,這項研究不僅僅是為了分析並且匹配很多人的DNA,而且還能追尋到每個家譜中的四代人。這是把歷史進行個性化的科學,但要達到這一目的,他們首先要讓十萬人貢獻出自己的血樣。

不完全是出於巧合,猶他州是世界上開展如此大規模研究的最佳地點,因為那裡有非常巨大的遺傳學數據庫。因此,研究小組首先從楊百翰大學這個觸手可及的目標開始著手,伍德沃德把幾個學生也派進了項目組,他說:「目前每個猶他州人的祖先160年前都不在這裡,因為在美國,除了原住民之外,其他人都是外來移民。因此,當你把家譜信息同搜尋到的DNA信息相比對時,就相當於迅速地進入到其他很多地方採集了血樣。」這個小組用了兩個星期就收集了3000份血樣,用一年的時間收集了10000份血樣,每份血樣都含有200年到300年歷史的宗譜和地理信息。這個項目很見成效。

在伍德沃德接到索倫森凌晨打給他的那個電話12年以後,我在伍德沃德的鹽湖城實驗室裡拜訪了他。我問他是如何說服人們參加這個項目,如何讓項目延伸到了鹽湖城以外的地區。他說,當猶他州的人口群體多樣性被採集殆盡之後,項目組又充分利用了遍佈世界各地的耶穌基督後期聖徒教會(LDS)的家族歷史中心,並且與很多家譜協會進行了接洽。

伍德沃德的小組請人們將獻出自己的DNA當作慈善行為。儘管這個研究項目獨立於耶穌基督後期聖徒教會(LDS),但LDS的確幫到了項目組,因為教會早已經有了基於家譜的完善的慈善活動模式了。實際上,索倫森到挪威的最初目的是為他的祖先進行洗禮,讓他們加入LDS.

雖然LDS家族歷史中心的網絡很大,但是還不能囊括全世界的數據。因此,伍德沃德小組一旦將LDS教會網絡提供的數據挖掘殆盡之後,就必須尋找那些不但對這個研究項目非常感興趣、願意參與的群體,而且其自身的歷史很有說服力的群體。於是,他們奔赴非洲收集了10000份血樣,之後又到了亞洲,來到吉爾吉斯斯坦以及其他許多國家。他們最先去的國家之一是絲綢之路的主要途經國——蒙古,在那裡收集了3000份血樣。

伍德沃德還以索倫森為名,設立了「索倫森分子遺傳學基金會(SMGF)",這是最早的遺傳家譜公司之一。這個機構最終從全世界收集到了100000份血樣,並分析了它們的Y染色體和線粒體DNA.在那個時代,這是個耗資巨大的研究項目,簡直讓人難以置信。但是,隨著遺傳學的飛速發展,他們當時所取得的成就同現在我們掌握的信息資源相比,就很有限了。2012年,索倫森分子遺傳學基金會被世界最大的家譜公司Ancestry.com收購,自那以後,調查挪威人DNA的項目就完成了,而且研究成果超出了那位摩門教億萬富翁索倫森的預想。現在,伍德沃德領導的團隊可以將幾百萬個有文件記載的家譜和70萬個基因位點聯繫在一起,這些基因包括常染色體DNA、Y-DNA和線粒體DNA.

遺傳和基因組的相關知識從發現到讓公眾接受,其速度之快是史無前例的。到2014年為止,除了美國《國家地理》雜誌的基因圖譜項目以外,還有Family Tree DNA公司、23andMe公司和AncestryDNA.com公司都可以為公眾提供DNA檢測和家譜查詢服務。這一切取決於你購買了哪種服務,你可以對Y染色體中的111個片段進行檢測(如果你是男性),還可以檢測線粒體DNA,或者22個無性染色體。(23andMe公司還可以檢測人體的健康和特質,詳見第十四章。)一旦你掌握了這些基因組數據,還可以把它們用於DIY網站或非商業性網站,如SNPedia、Interpretome以及Dodecad來進行解讀。這些遺傳家譜公司經常調查的基因組部位遠比幾年前學術界所考慮的部位要多。當涉及個人遺傳研究時,有很多個人可以付出許多研究人員無法承擔的高額費用,也就是說,Family Tree DNA公司等機構擁有的基因庫實際上屬於眾籌的極具價值的數據庫。世界最大的Y染色體和線粒體DNA數據庫不是由研究機構建成的,而是由Family Tree DNA公司創建的。

那麼,這些非比尋常的公司到底是什麼樣子的呢?畢竟,基因組是一個信息寶庫,信息量是美國國會圖書館的好多倍,也超過了早已消失的古埃及亞歷山大圖書館。我真想親眼看看這座寶庫,於是我訪問了Family Tree DNA公司。這家公司是1999年在得克薩斯州休斯敦成立的,是第一家遺傳家譜公司。那天,天氣極其炎熱,我從休斯敦機場開車,穿過雜亂無章的市區,來到了一幢不太起眼的辦公樓。接待我的是貝內特·格林斯潘,一個留著醒目鬍鬚、帶有得克薩斯州口音、善於表現的人。

格林斯潘坐下來準備跟我談話,但是當我問他是否可以看看檢測DNA的實驗室時,他卻說:「看那些地方沒意思。」我急忙說:「哪能沒意思?我還從來沒見過DNA實驗室呢,一定非常有意思。」他把我領到套房後邊的房間,顧客送來的DNA血樣在這裡開封。這間房與休斯敦遠郊的辦公用房沒什麼兩樣。房間很小,配有傢俱,也有窗戶。在房間的一角,有一台機器正在運轉,發著輕微的聲響。格林斯潘說,只要你用對了機器,你就不需要很大的空間,也不需要那些閃閃發光的整套設備。這話說得沒錯。

格林斯潘給我看了看接受檢測的人送來的樣本,通常是唾液或者口腔黏膜塗片。他們首先把樣本送進機器,把DNA分離出來。再把DNA放進PCR(聚合酶鏈式反應機)裡,俗稱「搖擺烘烤機」。格林斯潘說,這個機器「給DNA加熱,然後降溫,再加熱,再降溫。通過溫度的升降,產生的DNA就越來越多。其主要目的就是擴大DNA的量,一開始好比從草堆裡找針,逐漸地找到的針就越來越多了」。這個步驟完成以後,把DNA放進冰櫃,這可是「世界上最昂貴的冰櫃」了,每個冰櫃可以在零下29攝氏度的溫度下儲存八萬個樣本。冷凍的樣本由機器人進行分析,這樣可以杜絕人為差錯。樣本分析是在一台裝有螢光磁珠的機器中進行的,如果在樣本裡有他們要找的DNA成分,這些成分就會附著在磁珠上。

公司一般以圖解的方式顯示被檢測的染色體,如果是同一家庭的成員來檢測基因組,他們可以把各自的照片疊加在一起,這樣就能夠看出他們的DNA確切重疊之處了。譬如,你之前很清楚自己眼睛的形狀和姐姐的一模一樣,但是現在還可以清楚地看到你的3號染色體(或其他染色體)的某個部分與姐姐的一模一樣,你們倆的全部基因組真的出自同一種原材料。

所有公司都會對你的基因組揭示出的祖先信息給出解釋。譬如,你的Y染色體可能通常只會出現在非洲、歐洲、印度或蒙古男性體內。你可能會發現體內常染色體的某個特定基因序列,屬於芬蘭或韓國祖先遺傳基因的典型特徵。就在幾年以前,科研人員從人類的DNA中發現了遠古時代兩個非人類的穴居物種——尼安德特人和丹尼索瓦人的基因。這一發現震驚了整個科學界。如今,僅僅花費一點點費用,有些公司就能分析出你的基因組有多少來自於尼安德特人。(關於這兩個物種的更多信息,詳見第十二章。)

格林斯潘常常親自幫助客戶弄清對過去的疑問。譬如,有一位女士給他寫信,說據她所知,她的家族裡根本沒有猶太祖先,但是她祖父的名字是赫謝爾,而且她父親和叔父的中間名也是赫謝爾。幾年前,她發現她祖父有一張畫的背後印著幾個用古希伯來文寫的美術字「L'Shana Tova」,是手寫的新年賀詞,標明的日期是1891年。Family Tree DNA公司對她的DNA進行了檢測,結果顯示她極有可能就是猶太人。

還有一位女士,從小在西班牙長大,信奉天主教,而家族世代相傳的口述歷史顯示她家在20代之前有猶太祖先。通過檢測,格林斯潘發現這個女士的線粒體DNA與來自西班牙、希臘、阿爾及利亞、保加利亞和土耳其等地的西班牙裔猶太人的線粒體DNA相同。她請求格林斯潘給她寫一封證明信,她要把信送到猶太人的法院,來領取一張回歸證書,正式確認她是猶太人。

格裡斯潘對我說:「我差一點就把她的事扔在一邊不管了,因為這幾乎是無法驗證的,很難想像根據口頭相傳,就能確認一個家族屬於這麼一個少數群體長達20代之久,這太令人難以置信了。每逢我們在沒有DNA數據的情況下處理口述歷史時,我都非常擔心,因為研究事實靠的是多方面的證據,而講故事恰恰缺少證據。」

經過不到15年的經營,私人遺傳公司已經建立起了一個以遺傳學為基礎的社會關係網,與這個關係網相比,21世紀初的關係網絡簡直就是小兒科了。23andMe公司、Family Tree DNA公司和AncestryDNA公司的顧客能夠發現一大群有遺傳關聯的表親,他們不但能追尋家人,還能追蹤他們基因組中的特定片段。把幾百萬人的檔案記錄和他們的DNA分析結合起來,用戶可以建立一份貫穿幾百年甚至更長時間的人類關係網的拷貝,並在其中找到自己所處的位置。

當客戶有一個或一個以上的DNA片段與另一位客戶相同時,公司會提醒這位客戶。遺傳學家說這些片段具有「血統遺傳的特徵」,意思是它們出自同一個人,也就是說遺傳給這兩個人的DNA出自一個祖先。公司把這種DNA相匹配的人叫作「親戚」或者「表親」。從根本上講,你同某人的關係越近,你們所共有的DNA片段就越多,並且延續時間也越長。

據說,常染色體DNA起碼可以把你帶回五代人之前的歷史,通過常染色體DNA來確定第三代遠房表親的可能性是90%,第四代的可能性是50%,第五代的是10%。格林斯潘說,他聽說有人用常染色體DNA確定了第八代遠房表親。隨著科學的發展,找到更為久遠的表親的可能性還會增加。

如果某位祖先的後代足夠多,那麼甚至可以借助這些後代重構出這位祖先的基因組。每個在世的人的基因組就如同是虛擬拼圖中的一塊,可以拼出這個群體共有的祖先基因組。這些祖先沒有留下有文字記載的歷史記錄,但是從理論上講,他們的基因組可以重現,雖然還沒有人真正實踐過。伍德沃德說:「只要有足夠的人體信息,你就可以重現過去,譬如,再造1850年英國西蘭開夏郡利克鎮的人口狀況。」

幾年前,一位學過分子生物學的知識產權律師布萊恩·貝廷格,開始搜尋他曾祖母的DNA.她生於1889年,活得很長。貝廷格今年38歲,他還記得他小時候曾祖母的模樣。由於他的曾祖母是被收養的,因此,對於她的家族血統,貝廷格一無所知。然而,她是個「影響力很大的極其強壯的女人」,貝廷格把他家族裡的一些特徵叫作「漣漪式特徵」,這些特徵好像都來自於這位曾祖母。為了探尋曾祖母的來歷和她對於這個家族的影響,貝廷格開始收集她後代的DNA,以便從他們那裡分離出遺傳自曾祖母的基因。

在曾祖母的兩個孫子的幫助下,貝廷格確定有35個DNA片段出現在她和她丈夫遺傳下來的染色體中。下一步,他要分別去尋找與這些DNA片段對應的親戚,以便把出自這位曾祖母的DNA片段與出自她丈夫的DNA片段區分開來。在說服他的家人參加這項研究的同時,貝廷格還運用表親匹配的辦法尋找到了更多具有上述DNA片段的人。

對於那些之前很少想過自己的基因的人來說,解讀個人基因組分析報告是件很惱人的事。貝廷格第一次檢測DNA是在2003年,當時的檢測公司可以解讀常染色體上的175個標記;而現在他們可以檢測100萬個標記。結果,貝廷格成了遺傳家譜學領域的領軍人物,並成為一個精英團隊中的一員,這個團隊致力於幫助人們瞭解表親關係網絡和解讀自身的DNA信息。貝廷格主要通過自己廣受歡迎的博客網站TheGeneticGenealogist.com來幫助人們。

塞西·穆爾是一位遺傳學家兼知名博主(YourGeneticGenealogist.com)。當她的一個侄女要結婚時,穆爾打算幫助侄女合併一份家譜,從那時起她就開始對這個主題感興趣了。她說:「對於寫家譜,我知道的並不多,但這非常容易使人上癮。」穆爾曾經是個電視節目製作人,現在是遺傳家譜學顧問,與小亨利·路易斯·蓋茨合作,專為電視節目《尋根》和《家譜學巡演》出謀劃策。她已經創建了一個全新的職業,這個職業不僅僅要解釋和闡明DNA的方方面面,還要當遺傳方面的偵探,幫助委託人尋找丟失的信息。現在她的日常生活裡充斥著DNA,她每時每刻都離不開DNA,甚至夜裡睡覺都在想著DNA.

穆爾還是Family Tree DNA公司「被收養人DNA項目」的管理人員,越來越多曾被收養的人請她幫助尋找原來的家人。她說:「我每天都收到人們發來的郵件,這些人發現自己從遺傳學上講並不是原來的自己了。有時候,人們突然發現父親並不是親生父親,還有人說他們可能出生時在醫院裡被人調換了。」還有一次,有人請穆爾幫助查詢自己的父母,說自己是在1916年被人放在這家人的門口外面的,還有人說自己是從垃圾箱裡被人撿到的。在過去的一年裡,就有六個人代表曾經被人遺棄的嬰兒找她幫忙。

有的時候,人們沒有追尋到預想的祖先,譬如,有人以為自己是愛爾蘭人,但是檢測結果卻顯示他們更有可能是俄羅斯猶太人。穆爾說:「這只是我的個人經驗,人們之所以打算檢測一下自己的DNA,是因為他們總覺得自己在這個家裡不太對勁兒,或者腦子裡老是有疑問。這樣的人可太多了。」

通過從遺傳家譜數據庫中探尋人們在染色體中所共有的DNA片段,穆爾幫人找到了失聯的兄弟姐妹,甚至父母。她先順著表親家族家譜找到他們共有的祖先,然後再順著這位祖先向下追尋,直到他們的父母。她說:「你先順著家族樹向上追尋,然後再自上而下地追尋。譬如,如果預測的二代表親和一個尋找生身父母的人(也許是高曾祖,如果他們共有的DNA不太多的話)共有一個曾祖,我們就可以順著家族樹向下追尋,找到年代、地點、性別都能對得上的人,問題就解決了。」有的時候,穆爾直接找到了相對應的人,因為從DNA中發現兩人在很多染色體中都有共同之處,這說明他們是兄弟姐妹關係,或者是父母與子女的關係。穆爾建議她的委託人把自己的樣本送到23andMe公司、Family Tree DNA公司和AncestryDNA公司,因為這三家公司共同管理著藏有一百多萬個常染色體的數據庫。穆爾說:「你必須在這三個池塘裡釣魚,才能確保取得可信的調查結果。」有時候,她只找到了一個大致的祖先群體,譬如,最近一個委託人發現自己原來是墨西哥人,僅此而已。

在遺傳家譜學的幫助下,很多人的謎團得以揭開。如果我們把查尋的中心轉向不同的人類群體,共有的常染色體DNA就可以把我們帶到八代人以前的時代。

現代文明很善於保存近期的一般信息,自從發明了考古學和古人類學之後,我們也可以恢復一些遠古時代的信息了。然而,要想瞭解關於古人的更多信息,我們就必須付出更多的努力才行。我們或許對於19世紀和18世紀的人物,甚至生活在1000年前的皮克特人,以及生活在2000年前的古羅馬人有種親近感,但是對於生活在2000多年前的絕大多數人,我們幾乎已經感覺不到與他們有任何聯繫了。從他們留下的遺跡中,我們可以適當地瞭解到當時的一些信息,但是幾乎感覺不到他們在現代社會中得到了某種傳承,不像近500年來湧現的大人物,從列奧納多·達·芬奇到萊特兄弟,我們能夠清楚地說出他們的發明創造,以及留給我們的各種文化遺產。