生命科學

人類跟老鼠是近親!

13種脊椎動物基因組的先驅性比較研究

撰文/王心瑩

生命科學

人類跟老鼠是近親!

13種脊椎動物基因組的先驅性比較研究

撰文/王心瑩

今年4月,以美國國家人類基因組研究院(NHGRI)與能源部為首的「國際人類基因組定序團隊」,宣佈完成99%的人類基因組定序計畫,決定了其中約30億個DNA鹼基、四萬多個基因的排列方式。4月的大消息公佈過後,分子生物學家還是沒閒著,接下來6月定序出Y染色體的大部份序列、7月針對人類的第七號染色體序列進行深入分析,都是基因組研究的重大成果。


然而,若想深入了解基因序列所代表的意義與功能,光是定序仍然不夠,必得結合更進一步的分析才行。在隨後的「後基因組時代」中,解讀這些基因的功能便成為最重要且艱鉅的工作,許多學門也應運而生,包括蛋白組學,研究基因所轉錄出來的蛋白質種類與功能;包括醣組學,研究修飾蛋白質的各種醣類與各種不同功能;更包括近年來最火熱的生物資訊學,由於實驗數據量增加神速,幸虧電腦處理速度也高速同步加快,再加上資訊科學專家設計出適用的分析工具與演算法,才使基因組知識的應用範圍越來極廣,衍生出基因圖譜的繪製、藥物篩選與研發等研究領域。


除此之外,比較不同生物間的基因序列差異、繪製出演化的關係圖,一直是基因組學的另一個重要研究領域,由此更能了解自然史中生物的演化過程與親緣關係、基因在演化過程中的功能演變,以及我們人類的基因究竟從何而來、又有哪些重要之處。


而繼前述兩項染色體定序成果都在《自然》刊出,8月14日出版的最新一期刊物,又發表了13種脊椎動物基因組的比較結果。這項仍由NHGRI領銜的大型研究計畫,結合數個學校的頂尖研究人員,比較人類、黑猩猩、狒狒、貓、狗、牛、豬、大鼠、小鼠、雞、斑馬魚與兩種河豚的DNA序列。NHGRI院長、15年來領導全球基因組研究的柯林斯(Francis S. Collins)認為,比較這麼多種生物的基因組,可讓我們更了解自己基因組所蘊藏的訊息,也才能找出關於基因功能的更多資訊。


領導這個研究團隊的NHGRI首席資深科學家葛林(Eric D. Green)則指出,他們在計畫中所建置的基因序列演化資料庫,是目前為止最龐大、最多樣的一個,研究人員取其中一段序列,比較多種不同生物的差異,可對脊椎動物的基因組演化過程有最初步的了解。


研究人員以人類第七號染色體上一段含有10個基因、大小為1.8Mb的DNA為標的,在其他12個物種的基因組中找出與之相對應的12Mb段落,做為比對的依據。而研究中的生物資訊分析與演算法的研發,由美國賓州州立大學、加州大學聖克魯茲分校及西雅圖華盛頓大學等團隊參與,所有分析結果可在加州大學聖克魯茲分校的「基因組生物資訊網站」上查詢。研究人員主要著眼於「轉位子的插入型態」,這是一種基因組的變化方式,比較各種生物之間變化方式的不同,來決定生物間的親緣關係。


此次研究最主要得到三個初步結論,一是與靈長類(即人類、黑猩猩與狒狒等)最親近的是齧齒類(大鼠與小鼠),食肉類(貓、狗)和偶蹄類(牛、豬)反而較遠。這在過去一直未有定論,甚至有科學家分析多種生物的粒線體基因組,認為靈長類與食肉類和偶蹄類有較近的親緣關係,但這項最新的分析方法與之有不同的結果。


第二個結果則是,在不同生物的基因組中,不含基因的DNA段落竟然沒有太大的差異。過去總認為,某段DNA序列若是在不同生物身上有高度的相似性,一定表示這個段落具有非常重要的生物功能(而且幾乎一定是可以製造出蛋白質的基因),所以在演化中不會改變太多,以免喪失了重要功能;這類基因最有名的例子便是血紅素的基因了。以前科學家手頭上的完整基因組序列不多,常常只是拿兩種生物來比較,而此次拿了13種序列比較,才發現不含基因的DNA序列還是有高度的相似性,表示這些段落並非沒有用處,很可能帶有我們所不知道的生物功能。


此外,在演化過程中,各種動物的基因組會發生變化,但是變化模式似乎沒有太大差別,可能是因為同樣的變化在不同基因組中造成不同的效應,才產生了如此多彩多姿的生物世界。


研究團隊建置了龐大的資料庫,他們打算要比對100個DNA段落,而現在才只做了第一段,其實要做結論還早得很,不過無論如何,他們所建立的研究方法,應該是相當重要的一套系統。此外,由於定序一種生物的基因組大約要花上5000萬美元,而資源有限,如果能依照研究需要,決定該先定序那一類的生物,絕對是個好的方向。



【延伸閱讀】

※《科學人》2003年8月號的〈連鎖信的演化史〉,介紹生物資訊學家分析基因組的方法。

※美國國家人類基因組研究院(NHGRI)網站新聞

※本文分析結果可在美國加州大學聖克魯茲分校的「基因組生物資訊網站」上查詢

※刊登於2003年8月14日出版的《自然》的文章 "Comparative analyses of multi-species sequences from targeted genomic regions"