讀古今文學網 > 解碼生命 > 第17章 藍色星球和新生命 >

第17章 藍色星球和新生命

有機生命在無盡的波濤之下產生,

在海洋的珍珠洞裡孕育成長;

先為幽芥之形,雖球面鏡下不可觀,

泥上移動或水中穿梭;

他們,世代繁盛,

獲得了新的能力,呈現了大的肢體……

——伊拉茲馬斯·達爾文,《自然的殿堂》

從我最初研究跳動的心臟細胞起,我就被我的興趣而不是我的同行所推動。在我離開塞雷拉的黑暗日子裡,我再一次被自己的經歷所鼓舞。我的一生都鍾情於石油——我喜歡汽車、摩托車、機動船、帆船和飛機——結果我耗損了大量這種古生物產品,增加了我向大氣排放的二氧化碳量。但是多年以後我從一個不計後果的超級燃料消費者變成了一個積極尋求替代品的關心環境的人。我要從哪兒開始新的冒險呢?哪裡會有比海洋更好的地方呢?是海洋維持了我們的行星和我們的心智。如果我們想要準確評定氣候變化的影響,我想我們應該搞清楚海洋裡到底有什麼,例如海洋酸化。我有一個計劃可以做這些研究,而且作為一個額外的收益,這個計劃還可以提供一個新的工具幫助我們與全球變暖作鬥爭。

因為我們是陸生動物,我們生活在岸上,甚至我們對氣候變化影響的觀點也是被我們人類中心化的生命觀所支配。但是從太空看來我們的地球是藍色的。生命開始的第一個舞台可能就是在這裡,40億~50億年前的鹹水裡,在那裡,當無生命分子和其他化學分子與從生命的生物化學劃分出去的線交叉之時,一些我們今天定義為活著的東西出現了。關鍵的物質是可以自我複製的細胞,即包在脂質膜裡的蛋白質和遺傳物質的複雜混合體。現在海洋生物有令人稱奇的多樣性,從大鯨魚到小細菌,大多數我們還不很瞭解,尤其是大小處於顯微鏡可視範圍末端的微生物我們就知之更少了。解決氣候變化問題的方案可以源自對生物多樣性的理解以及理解它是怎樣利用太陽輻射吸收二氧化碳的。我想我可以進一步利用這些知識:設法去模擬幾十億年前海洋中發生的事件,從而得到一個新的生命種類,一個極有可能的美好前景。

當我從加勒比海回來的時候,我就馬上開始工作了。我建立了一個新的非營利性的研究所,基因組學促進中心(TCAG),並申請到了免稅待遇。有了克雷格·文特爾科學基金(JCVSF)的支持以及來自出售人類基因組科學、棣文薩酵素公司和塞雷拉的創立者的股票資金,我現在可以啟動它了。我從塞雷拉僱用了希瑟、林恩和克裡斯,我們開始在我的馬裡蘭波托馬克河的地下室裡工作,一直到我能租到一個新的工作場所。我有幾個科學想法想要盡快地實行。

我最關心的事情就是把我的環境計劃建立並運作起來。無可置疑的科學證據表明每年我們向大氣排入的35億噸的二氧化碳正在改變著全球的氣候模式,簡而言之這種改變是現代生命所不能承受的。但是我想做的不僅僅是少使用些石油或汽油或者安裝一個太陽能板。我認為基因組學可以提供一些獨特的東西。海洋生物的霰彈槍測序法可以簡要反映現在海洋的健康狀況和為日後的監測提供幫助,同時也可以幫助揭示創造我們絕大部分大氣的微生物的性質。海洋微生物的代謝機制也可能會給我們提供一個新的方法製作替代燃料,比如氫、甲烷或者乙醇。

我成立了生物替代能源研究所(IBEA),聘用海姆·史密斯作為它的科學顧問。開展環境基因組學研究需要大量的DNA測序裝置,我對此是有先見之明的。我不得不勸說我的基金委員會去冒一個4千萬美元的風險,建立一個與我們在塞雷拉時相當的新裝置。我們建立了一個新的名叫JCVSF聯合技術中心(JTC)的非營利性組織,該組織也同時為TIGR測序。就在希瑟和她的團隊搬進馬里蘭州洛克維爾一座臨時建築物時,一座新的11000平方米的研究建築在我幾年前用捐助經費購買的土地上開工了。所僱用的員工很大比例是富有進取精神的,由於塞雷拉的大幅裁員,我們的企業發展迅速。很多我以前的朋友和同事過來加入我的新的研究組織。

就在環境保護第一次成為我的研究重點的時候,我在基因組科研前線還有一些未完成的事情要做。我想利用我的新式基因組學實驗室進一步發展我們已有的成就,把我們對它的理解轉化為藥物,我也想繼續進行人類基因組測序的研究並充分考慮它的倫理含義。同樣重要的,也是出於自尊,我也想與來自政府支持的基因組科學家的攻擊和批評徹底做一個了結。在基因組競爭結束後,大家都繼續自己的生活,但是事情並沒有完,隨著爭奪單獨測序人類基因組的榮譽的鬥爭的繼續,敵意變得更激烈了。

也許最為臭名昭著的例子發生在2002年4月,當時《分子生物學雜誌》[1]發表了題為《人類基因組計劃:一個競賽者的觀點》的文章。這篇文章是由華盛頓大學的梅納德·奧爾森撰寫的,它曾被他的同事稱為「基因組計劃的良心」[2]。在薄薄的面紗下他打算把榮譽從我這裡拿走給他的同事,他又回到我們的方法是否是真正的新方法這個老生常談的問題上來了:「文特爾聲稱,他『發明』的全基因測序法是基於他領導測序了一個小細菌基因組,該基因組幾乎沒有重複。」接下來他又斷言我是個騙子:「與文特爾在1998年6月所做的宣誓證詞不符,塞雷拉把它的數據全部秘而不宣。」奧爾森的確給了我一個榮譽,因為「塞雷拉一開始毫無疑問地加速了第一次人類基因組測序,使其提前了兩年完成。」

在此之前我就寫了一份對蘭德、薩斯頓和沃特斯頓的《分子生物學雜誌》文章的辯駁[3],文章認為他們應該得到單獨享有測序人類基因組的榮譽,因為我的全基因組霰彈槍法測序已經失敗了[4]。這反過來引得蘭德等人在一篇非科學的評論文章裡使用一些花招提出了同樣的要求[5]。曾在TIGR和塞雷拉做過基因組拼接的格蘭傑·薩頓對蘭德特別生氣,因為他認為就算薩斯頓和沃特斯頓沒有理解塞雷拉的成就(畢竟他們兩個是生物學家,在數學和計算機方面不是專家),蘭德一定應該理解了。不僅因為他有很深的數學背景,而且因為他自己的人正在我們工作的基礎上,發展一個名叫阿拉喀涅的他們版本的全基因組霰彈槍拼接器。

格蘭傑認為那時我們已和好很久了。在《分子生物學雜誌》文章發表較早之前的2001年6月,在克林頓總統的激勵下,來自塞雷拉和國際人類基因組協會的計算生物學家們以中立方的身份(位於馬裡蘭的切維蔡斯霍華·休斯醫學會)討論測序和裝配序列。就像《紐約時報》報道的一樣:「沒有雙方領導出席的計算生物學家間的聚會氣氛是熱烈的。」[6]格蘭傑向與會者說明了為什麼在完全不吸收公共數據的情況下,就可以重新召集塞雷拉人類基因組並得到更好的結果是可能的。遭受到接踵而來的攻擊後,格蘭傑的狂怒是可以理解的:那篇在《分子生物學雜誌》論文的結果一年之前就已經被在切維蔡斯會議提出的數據駁倒了,「我們已經提出了一些相當令人信服的材料說明全基因組霰彈槍測序法是多麼好了」。

事實上,到目前為止,在公共計劃那一方還是有一些重要人物是相信我們的。其中之一是加州大學聖克魯茲的吉姆·肯特(Jim Kent),這個留著鬍子的粗壯的人物被認為是一個明星選手,他曾只用了四周時間就獨自把在一百台奔騰Ⅲ電腦上運轉的漁叉拼接軟件的程序組合在了一起,正好趕上白宮發佈會。他做這一切時還是個研究生[7]。我對他的這些成就印象深刻。

肯特並不同意那篇在《分子生物學雜誌》文章的結論,因為對他來說,公眾和塞雷拉數據[8]之間的差異是很明顯的——甚至在我們測序老鼠基因組之前——「蘭德等人在《分子生物學雜誌》文章中設想的公共數據的重組可能是不完全正確的。」他下結論說,「老實說,我的確認為塞雷拉的拼接工作大體上比我們的好(你應該希望這樣,因為除了他們自己所做的,他們還可以看到我們的數據)。」他補充說,蘭德自己的阿拉喀涅拼接器也是與塞雷拉所用的非常相仿,「它從另一角度暗示了塞雷拉方法雖然帶有某種限制,基本上運作得還不錯。」

回憶起當我們結束人類基因組接著測序老鼠時,我們沒有理會基因銀行中有限的公共計劃數據,而僅僅使用了我們自己的霰彈槍數據,所以我們又一次躲過了那些對我們真正的成就所提出的連珠炮似的詭辯和歪曲。利用一個加強的拼接器我們最終得到了比我們曾從人類基因組那裡獲得的更好的結果。阿里·帕特諾斯是當時的G5之一,重新看過蘭德等人的《分子生物學雜誌》文章後,他總結說文章「坦白地說糟透了,他們的方法是有效的,他們對老鼠所做的工作是最好的證明。」甚至我的老對手邁克·摩根也承認「你在否決某些人時一定要非常確定,因為通常它會起反作用。所有的那些文章不管怎樣都會適得其反。」

雖然我發表了第二篇辯駁的文章[9],但是我一直都很清楚,數據是贏得科學爭論的唯一方法。我與邁克·亨克皮勒在ABI進行了接觸;他也同樣被這些不斷的非難搞得心煩意亂,也想確保真實歷史記錄。鑒於我曾在阿普萊拉的遭遇和與托尼·懷特關於數據發表的爭吵,我在向ABI購買3千萬美元新DNA測序儀時附加了一個具有法律效力的合同,據此我們可以出版塞雷拉的數據和在公共領域不受約束地使用這些數據。(在2005年,塞雷拉將停止出售基因組信息而使它全部進入公有領域。)另外,我的研究所將會複製完整的基因組數據用以學術研究。一旦這個協定簽署後,我們就與塞雷拉剩下的科學家合作,我們將會把塞雷拉的整個基因組拼接與包括公共計劃的「終結」版本在內的其他版本的基因組進行比較。

索林·伊斯特裡以前是吉恩·梅爾斯領導的一個團隊的高級成員,現在是塞雷拉生物信息學的領頭人,他擔任新的合作計劃的領導。數據分析大約會花費一年多的時間,而且要發展很多新的計算工具來進行第一次整個人類基因組的比較。我和《分子生物學雜誌》的編輯同享這一計劃,他很高興我們將使所有的數據都可供使用,而且他說在我們的文章完成後他願意發表它,也樂意幫助我們結束那些口舌之爭。

那些數據是強有力的,它證明了全基因組霰彈槍法測序是精確的。當這項工作最後在2004年初發表時,它使我們可以精確地比較公開和非公開的基因組:塞雷拉的結果提供了更多各基因組的順序和位置,但是公共計劃的序列提供了更好的重複片段覆蓋。政府和威爾康信託基金實驗室還在繼續完善他們的基因組序列,這件事將花費他們超過4年的時間和大約1億美元(或許更多,具體的數目還不知道)。對比證實了公共數據每一次質量的改進都是對塞雷拉唯一拼接的逼近,不管是從品質還是精確度而言(各基因組順序和位置)。塞雷拉的拼接事實上彌補了「終結」基因組中很多剩餘的缺口,而該基因組序列是在2004年由公共計劃在《自然》上大吹大擂地宣佈的[10]。我們沒有召開記者招待會就發表了我們的文章。這些數據本身就夠有力的了[11]。

隨著公開論戰的最終結束,我打算開啟一個人類基因組研究的新局面。在發表了人類基因組裝配分析文章之後,TCAG(在與三個非營利性的研究所合併以後,它現在更名為文特爾研究所)已經開始著手排序和分析單個個體的基因組了。這個個體就是我。之所以選擇我是出於科學研究的考慮,而不是自負或傲慢。早期包括塞雷拉基因組的合成版本,過分低估了人類變種的數目。而政府所支持項目的基因組是由來自有限個體的片段(複製體)拼接起來的,所以看不到遺傳變化。塞雷拉的基因組來自於五個個體基因組的共有序列,包括我在內。我們使用贏者通吃的原理:我們的基因組使用在五個人中出現次數最多的部分。這也同樣失去了由indels(插入/缺失多態性)導致的變種,indels是遺傳密碼中超過一個字母被改變的地方。當在一個個體DNA中插入/缺失一個較大的片段時,拼接程序並不記錄這一變化,除非它發生在序列的多數部分。

換句話說我們雙方在2000年6月大張旗鼓地公之於眾的基因組並沒有說明我們一開始想要解讀它們的一個關鍵原因:一個由不同人混合或拼接的DNA抹去了個體差異,而這些個體差異會讓我們一些人易患癌症、心臟病或其他的疾病(儘管已經有研究工作繪製過單個字母的變化圖——單核甘酸多態性)。早期的基因組僅僅關注一個人的遺傳密碼的一個複製體,而事實上我們繼承了分別來自父母的兩個。在一些位置上,父母中的一方的基因起主要作用,而在另外一些地方是另一方基因起主要作用。我們需要檢查所有60億而不是30億個字母的編碼,才能得到最準確的人類基因組序列的真正的面目。

因為很明顯的原因是,我們從來沒有宣佈說我和海姆是最初測序的兩個捐獻DNA的人,同時我們也沒有刻意隱瞞。當調查TV新聞雜誌《60分鐘》報道了基因組競賽時,它揭露說我是DNA捐獻者之一;但是直到後來當《紐約時報》的尼克·韋德(Nick Wade)來採訪我的新研究所時,我的基因組才真正變成了新聞。我對當時的談話沒有多想,直到接下來的週六早上當《紐約時報》送到我家時我才注意到它的頭版報道《科學家披露基因組的秘密:它是他的》[12]。這個標題是不正確的,但是我猜想這有助於證明這樣一個事實,那就是只有《紐約時報》說它是新聞時它才成為新聞。

失明發現

媒體曾興致勃勃地報道過關於我的基因組的一些令人沮喪的發現。一個頭版報道說:「應《華爾街日報》的要求,文特爾博士的同事檢查了他的一些與健康風險相聯繫的特定基因。在一個電話會議中文特爾得知,他的基因表示他失明的可能性很大。當你研究你的DNA時,你的生命可能會以如此方式呈現。」[13]

這份報紙提出,在我的基因中有一個名叫補足因子H(CFN)的基因有一個單字母的變化(一個名叫rs1061170的SNP),一些研究把它和「非常高」的患黃斑變性可能性相聯繫,黃斑變性是一個導致視網膜中心變性的常見病,它會毀壞中心視覺的功能。

在我的兩個CFH基因複製體中,有一個有這樣的變異,這使我患此疾病的可能性增加了3~4倍。如果兩個複製體都發生變異的話,可能性就會上升到10倍以上。

早期的研究認為CFH可能在防止血管發炎和損壞方面起關鍵作用,所以它的變異會導致發炎從而致盲。因子H的一個已知的性質是它管理補足系統的活化,補足系統是一個相關蛋白質的集合,它是身體的第一線的防禦體系——一個先天的體系——它攻擊外來的入侵者同時避免對於任何健康細胞「自身」的攻擊。

可以說我的基因組在塞雷拉基因組中佔了主要部分。就像在第十四章中提到的,基因組拼接小組希望能較多覆蓋五個人中某個人的基因組,以確保我們能得到一個精確的拼接。雖然海姆的DNA已經在高質量的5萬鹼基對文庫中了,但是因為早期的來自於我的基因組的測序文庫在2000鹼基對和1萬鹼基對範圍最有效,這些文庫被選為3倍測序範圍。總的來說,我的DNA在最後的塞雷拉基因組中佔據了60%。

癌症和我的基因組

很多人生來就有一個變異從而使他們更容易發生腫瘤。一般來說,一些單核甘酸多態性(SNP)——單字母拼寫錯誤——可以明顯地改變一個基因的行為,同時其他的可能有更微妙的功能效果,使個體更易於患與其遺傳背景和環境一致的疾病(例如,有一些基因會增加吸煙者患肺癌的概率,但是對不吸煙的人沒有影響。)還有一些則根本不起任何作用(不具功能性的SNP)。

基因編碼蛋白質,在這三個SNP類型中,最有趣的是那些改變蛋白質結構,從而通過改變氨基酸蛋白質的一個基本單位來發揮作用的類型。它們被叫作「錯義SNP」。目前為止,好消息是,通過檢查尋找我的基因組中與癌症有關的四個基因——Her2、Tp53、PIK3CA和RBL2——的變異後,我們發現了兩個錯義SNP,它們與癌症沒有已知的聯繫,以及兩個未知效用的異常SNP。其中一個SNP發生在我們稱之為保守位的PIK3CA上,它是蛋白質很少發生變化的部分,大概是因為它太重要了。

沒有數據能說明這個特別的變化是否會使我陷於更大的危險。但是PIK3CA屬於一個重要的基因族,該基因族編碼名為脂質激酶的蛋白質,該酶修改脂肪分子並指導細胞生長、變形和移動。我們知道有30%的直腸癌、胃癌和惡性膠質瘤的發生與PIK3CA變異有關,在較小程度上,它也與乳腺癌和肺癌有關。PIK3CA變異還會導致腦瘤的自發產生。我可能會更進一步研究它。

獲得一個人的基因組序列這件事也引發了一場爭論,就像基因組學中很多其他問題一樣。塞雷拉科學顧問團的成員們對於識別任何捐獻者的身份感到不安。阿瑟·卡普蘭(Art Caplan)把這個計劃比作無名戰士的墳墓,它是神聖不可知的。但是整個現代軍事DNA法醫學事實上將永遠不會有「未知」的未來。就像許多早期的醫學爭論一樣,從心臟移植到試管嬰兒,大家的態度隨著時間的流逝發生了翻天覆地的變化。對此最好的說明是,現在吉姆·沃森也讓一家新開的商業風險投資公司——454生命科學公司——測序他的基因組序列了,基於馬西斯·烏倫(Mathis Uhlen)開創性研究焦磷酸測序的工作,這家公司創造了一個測序儀,馬西斯的研究工作是在斯德哥爾摩完成的。

自從我牽扯進這項計劃的事情被曝光以來,我每次都被問及我們到底在我的基因組序列裡獲知了些什麼。(事實上直到2006年,我的密碼中所有60億個鹼基對的讀取才告完成。)2007年,我們把第一個現代人的倍數染色體基因組序列發表在一個免費開放的雜誌《公共科學圖書館生物學》上[14]。這個不可思議的知識真的困擾你了嗎?你害怕把它貼在網上讓全世界的人看嗎?在這本書裡,我總在主張和解釋我們的基因組很少能給出確定的答案,它們所能告訴我們的大概最好的表達就是某種事情發生的可能性有多大。只有當我們得到我們所有基因含義的那個大的圖景時——這將會花費數10年的時間——我們才可能指出它們是否可以告訴我們,我們有35%的概率患乳腺癌或結腸癌或其他什麼。

對我的基因組來說,我最大的失望是在2005年,當時我被診斷有兩種皮膚癌——黑素瘤和基底細胞癌。幸運的是兩者發現得都較早。然而我並沒有認真地組織去分析什麼導致這兩個腫瘤的基因突變,這本將是件令人神往的事情:看到我的基因組是怎樣對這些基因失去控制的,我的DNA是怎樣讓我這樣倒霉以至於我的細胞開始不顧我整個身體的健康而自顧自地繁殖。

但我還是可以大體上知道我本應該看到些什麼。癌症被認為是由一個基因缺陷的堆積引起的,一個流行的觀點認為這個基因缺陷在干細胞上有最大的影響,干細胞為特定的組織和器官提供細胞類型。對結腸癌來說,第一步是在一個名叫ras的成長基因上有一個缺陷,該成長基因使細胞繁殖形成一個息肉,即癌變前的增長。一般來說,息肉細胞中其他的增長控制基因也會遭到破壞,隨著腫塊的增大,更多的變異以一個極大的概率形成,因為快速繁殖的細胞更容易攜帶變異甚至「增變」基因,這推進了DNA的錯誤率。這就是我以前的一名同事——來自約翰·霍普金斯的伯特·佛哥斯坦(Bert Vogelstein)提出的多擊模型。他可以說是當今世界上最重要的癌症研究員。在文特爾研究所,我們有一個由鮑勃·施特勞斯伯格指導的正在進行的與幾個著名研究團隊的較大合作項目,其中就包括佛哥斯坦的團隊。在該合作項目中,我們正在研究癌細胞中基因的體細胞變化。體細胞變化是由諸如毒素和輻射等環境因素導致的非生殖細胞中基因的變異引起的。這些可能在一個個體身上導致癌症,但是它是非遺傳的癌症形式,不可能由父母傳遞給下一代。