遺傳密使RNA-科學人雜誌 Back to Top
編輯推薦

遺傳密使RNA

2004-11-01 麥惕克 ( John S. Mattick )
生物學家曾假設,只由蛋白質便可調控人類和其他複雜生物的基因;不過,另一套以RNA為基礎的調節系統雖然被忽略,卻很可能是發育和演化的關鍵,同時也是新藥物開發的契機。


「假設」可能是危險的,科學領域裡的假設更是如此。假設剛開始時,只是對手邊事實最說得通或最容易的詮釋。但當假設的真實性無法立刻驗證,或是它們的缺陷並不明顯,假設就慢慢晉級為信條,新的觀察都被迫配合。到最後,當假設無法處理越來越多棘手的資訊時,所謂的「正統學說」就會分崩離析。

我們對遺傳訊息的認識,可能正處於這樣的轉變。過去半個多世紀以來,分子生物學的「中心教條」指出:DNA的遺傳訊息密碼,會先轉錄成中介的分子RNA,然後再轉譯為構成蛋白質的胺基酸序列。這個流行的假設具體表現了「一基因一蛋白」這項教條,將基因與蛋白質視為同義字。在這個推論下,蛋白質除擔負細胞結構和酵素的角色外,必定也是調控(或活化)基因表現的主要因子。

這個結論主要推導自大腸桿菌之類的細菌和其他原核生物(缺乏細胞核的單細胞生物)的研究。事實上,這個推論對原核生物來說仍然正確。原核生物的DNA幾乎完全是由負責製造蛋白質的基因組成,而在鄰近基因之間,是調節基因表現的序列。(雖然原核生物也有少數可製造調節性RNA的基因,但只佔基因組中極小的比例。)

長久以來,研究者假設:分類上屬於真核生物(細胞都具有細胞核)的多細胞生物,包括動物、植物和真菌,也是利用蛋白質來控制所有的遺傳訊息。分子生物學先驅莫納德(Jacques Monod)總結了中心教條的普遍性:「對大腸桿菌來說是對的事情,對大象來說,也應該會是對的。」

然而莫納德只對了一半,現在有越來越多的結果顯示,在描述真核生物的分子生物學時,中心教條極不完整。蛋白質的確參與了真核生物基因表現的調控,然而另外還有一個平行而隱藏的系統,是由RNA構成,直接作用於DNA、RNA和蛋白質。這個受忽視的RNA訊息網絡,可能是讓人類這類的多細胞生物擁有比任何單細胞生物都遠遠不及的複雜構造。

有一些分子生物學家,對這項異端的學說抱持著懷疑、甚至敵對的態度。但是,這項理論可能可以解答演化和發育中存在已久的謎題,並能對以基因為基礎的醫學和製藥學產生深遠的影響。而且,這套最近發現的系統所提供的見解,將能革新所有複雜程式系統的設計,無論是生物系統還是神經機械系統(cybernetic)。


無所不在的RNA

1977年的一項發現,預言了目前眾人接受的基因運作觀點可能有問題。美國麻省理工學院的夏普(Phillip A. Sharp)和新英格蘭生物實驗室公司的羅伯玆(Richard J. Roberts)以及他們的同事,分別證實了真核生物的基因並不是由連續的蛋白質編碼序列所組成,而是在彼此分開的表現子(exon,含有蛋白質密碼的DNA序列)之間,有著通常相當長的插入子(intron),而這些插入的序列並不具有製造蛋白質的密碼。在真核生物的細胞核內,一段基因會先完整地轉錄成為原始RNA轉錄子(transcript);然後在基因剪接(splicing)的過程中,將插入子的RNA切除,重新組合出一段連續的編碼序列,成為信使RNA(mRNA),再將mRNA送到細胞質中轉譯為蛋白質。至於切下的插入子RNA,由於並沒有明顯的用途,一般都假設細胞會將它們分解回收。

既然插入子不具有蛋白質編碼,為什麼又會在真核生物的基因組中處處可見,而原核生物卻沒有呢?其實在人類的蛋白質基因中,平均95%以上的序列是插入子,大多數的分子生物學家認為它們是演化的殘餘物或是垃圾。插入子被解釋為:在細胞生物尚未演化形成之前,含有蛋白質編碼資訊的片段粗略地組合成第一個基因時所留下的古老遺物。插入子能在複雜生物中保存下來,或許是因為它們具有意料之外的用途:例如在演化時便於重新排列蛋白質片段,產生新的有用組合。生物學家也以類似的想法,假設原核生物之所以缺乏插入子,是因為微生物處於競爭激烈的環境中的結果:插入子的重擔被演化給修剪掉了。

然而有一項觀察,讓人不能草率地將插入子(和其他在基因之間看來無用的序列)當做垃圾,那就是每種生物基因組所含的DNA總量,和該生物的複雜度並無關聯。舉例來說,有些兩生類基因組的DNA是哺乳動物的五倍以上;有些變形蟲更驚人,可超過哺乳動物1000倍。過去數十年來,研究者假設,這些生物中蛋白質基因的數量與複雜程度之間相關性較高。但如果加上基因以外的插入子和其他垃圾序列後,這種關係就會消失。

但是自從研究者開始為不同物種的基因組定序後,就明顯的發現,傳統上基因和複雜度之間的關聯,其實很薄弱。像線蟲(Caenorhabditis elegans)這種大概僅由1000個細胞組成的簡單生物,卻有約1萬9000個蛋白質基因,比昆蟲(1萬3500個)多出50%,幾乎和人類(約2萬5000個)旗鼓相當。相對的,非蛋白質編碼序列和生物複雜程度的關聯,反而相當一致。

簡單的說,謎題如下:人類基因組只有不到1.5%負責製造蛋白質,然而基因組大部份卻都會轉錄為RNA,要不是人類(和其他複雜的生物)可以奢侈地進行毫無用途的轉錄,否則就是這些非蛋白質編碼的RNA具有沒有料到的功能。

這樣一連串的論證,和其他數量可觀的實驗證據,顯示了複雜生物的許多基因(對哺乳動物來說,甚至可能是絕大部份的基因),並不帶有蛋白質編碼,而是用來產生有調節功能的RNA。這些RNA可能傳遞了某一層次的訊息,而這層資訊對生物極為重要,特別是在胚胎發育期間,同時也在演化過程中,扮演了關鍵的角色。


從寄生到平行控制

要認識這點,可從對插入子的新詮釋開始。早期的假設認為,插入子在生命初形成時就已經存在了。不過相反的,最新累積的證據卻顯示,這些序列是在演化較晚期才侵入高等生物的基因;最有可能的情況是這些插入的序列衍生於能自我剪接、並可移動的遺傳單位,類似我們現在所說的第二類插入子(group II intron)。這些DNA是寄生性的遺傳單位,擁有特異能力,能將自己插入宿主基因組中,並能在轉譯出RNA後自行剪接。

第二類插入子很少出現在細菌內,原因不難理解,因為細菌沒有細胞核,轉錄與轉譯同時發生:RNA剛從DNA轉錄出來,幾乎就立刻轉譯成蛋白質,根本沒時間讓插入子的RNA從有蛋白質編碼的RNA中自行剪除。所以在大多數情況下,一個插入子就會使它寄居的基因喪失功能,而對細菌宿主造成有害的後果。在真核細胞中,轉錄發生在細胞核內,轉譯則在細胞質中進行,這種區隔讓插入子的RNA有機會將自己切除,也因此真核生物比較能容忍插入子。

當然,只要插入子得靠自己剪接進入或移出基因組,它們的序列就不能與第二類插入子相差太多。但是隨著真核生物演化出剪接體(spliceosome)的構造後,插入子的演化也可能大步邁進。剪接體是由具有催化功能的小RNA片段和許多蛋白質組成的複合體,能有效地將插入子RNA從mRNA的前驅物中切除。

剪接體的出現讓插入子不再需要自行剪接,結果等於鼓勵插入子增生、突變與演化。插入子內任何偶然的突變,只要對宿主有利,就會在天擇的篩選下保留。因此,插入子RNA能與蛋白質平行獨立演化。簡單的說,插入子進入真核生物後,可能啟動了新一回合爆炸般的演化,這次的主角是RNA,而非蛋白質。插入子非但不是毫無用途的分子遺骸,反而可能以RNA為中介,逐步得到遺傳上的功能。

如果這個假說是對的,那麼它的義意會非常重大。真核生物(特別是較複雜的生物)可能發展出一個遺傳運作系統及調控網絡,比原核生物還要精密複雜許多。在這個系統中,RNA和蛋白質可以平行聯絡、調控資訊。這樣的安排類似電腦和人腦中支援網絡控制的高階資訊處理系統。

細胞中功能性的工作,一般由蛋白質來擔任,因為蛋白質具有多樣化的結構和化學性質,然而在傳遞和調節與基因組本身相關的訊息以及活性時,RNA卻有一個蛋白質不及的優點:RNA可以帶有簡短而針對專一序列的訊息,有點像位元串或郵遞區號。這種編碼可以準確指引RNA分子找到其他RNA和DNA上的接受目標,結合的RNA-RNA和RNA-DNA,可以形成特殊的構造,而召集蛋白質加入,將訊息轉化為行動。


微RNA顯神威

RNA的位元串地址資訊,賦予這套系統驚人的準確度,就像數位電腦使用二元的位元串一般,如果要說RNA調節系統大體上是數位化的,一點兒也不算誇張。

以RNA為基礎的調節系統廣泛存在的證據雖然不完備,但卻相當有力。如果這樣的系統存在,我們可以預期會有許多基因演化成只表現RNA,以做為網絡中高階的調節訊息。而實際情況看來也是如此:最近在分析哺乳動物的轉錄產物後,已經鑑定出有數千個RNA,是不會轉譯為蛋白質的非編碼RNA。在所有的RNA轉錄子當中,至少有一半、甚至可能超過3/4的RNA是屬於這一類。

也有人推測,在這些RNA中,有許多會加工成能針對網絡中目標的較小型訊號分子。結果在植物、動物和真菌中確實也找到了數百種微RNA(microRNA)。微RNA從插入子和較大型的非蛋白質編碼RNA轉錄子衍生而來,其中許多與發育中的時程控制有關,像是幹細胞的維持、細胞增生和凋亡(組織重塑時進行的計畫性細胞死亡),而肯定還有更多這樣的小型RNA等著被發現。

這些RNA信號在找到位於其他RNA、DNA和蛋白質上的目標後,可以透過多種方式影響細胞遺傳程式的運作。舉例來說,它們可以通知各種基因,某種蛋白質的編碼序列已經轉錄,而這個回饋訊息可以啟動一連串的平行調整。更重要的是,RNA信號可以做為隱藏在遺傳物質中的前饋(feed forward)機制,能夠有效地控制基因的表現。果真如此,它們將可以解釋在細胞分化和生物發育過程中的一些難解謎題。


調節發育過程

想想人類胚胎的發育過程:一個受精卵逐步演變成100兆個細胞,這些細胞有各自的位置及獨特的功能,而組成了結構精確、形體美麗的生物。造成這種轉變的基因表現模式,可能大量仰賴了兩種作用:染色質修飾和選擇性剪接。

由DNA和蛋白質組成的染色質,是構成染色體的原料。在細胞內,會有一些小型的化學標籤(如甲基和乙醯基)接在DNA和染色質蛋白(核蛋白)上,因而決定了該DNA區段內的基因進行轉錄與否。最新的研究結果顯示,RNA信號可引導標籤「貼」在染色質上的動作,進而影響基因的表現。事實上,許多複雜的染色體活動,像是有絲分裂(即細胞分裂)和減數分裂(以形成精子和卵子的前驅細胞),以及多種複雜的遺傳現象,看來都需要仰賴影響RNA處理的生物化學途徑。

選擇性剪接則讓身體不同組織的細胞,能以相同的一組基因,製造出屬於自己的一組RNA和蛋白質。哺乳動物中含有蛋白質編碼的轉錄子,大部份都經過選擇性剪接。當插入子RNA從轉錄子中切除後,含有蛋白質編碼的RNA可以有多種方法連接組合,產生不只一種類型的蛋白質。這種現象對動、植物的發育無比重要,但還沒有人知道細胞如何指定要形成哪一型蛋白質。目前只發現有少數蛋白質能控制特定基因的選擇性剪接,因此,研究人員通常會想當然爾地假設,一般調控因子的微妙組合,能夠在不同的情境下活化或抑制選擇性剪接,但是,並沒有堅實的證據能夠支持這種臆測。

比較有可能而且在機制上也比較合理的,是RNA直接調節選擇性剪接。原則上,RNA分子可以標示或抓住原始轉錄子上的特定序列,精湛且彈性地引導剪接體結合各片段。有一個觀察到的現象和這個觀點相符:插入子和表現子的接點,也就是選擇性剪接發生之處,在演化過程中通常鮮少改變。此外,還有數個實驗室證實,人工設計來與該區域結合的反義RNA,可以修改培養細胞和整個動物體的剪接模式,因此生物體內非常有可能本來就存在這種現象,只是我們尚未偵測到。


控制複雜程度

像這樣的想法,自然會引發另一個更普遍的問題:哪類型的資訊以及多少這樣的資訊需要用來指引複雜生物的發育過程。建造複雜的物體,無論是房子還是馬,都需要兩種說明書:一種說明使用零件,另一種說明如何組裝。在興建房子時,我們需要指定的磚塊、木板和樑柱,但也要有建築設計圖來說明這些材料如何組合起來。生物學與工程學不同之處,是這兩種資訊都包含在一個程式中:DNA。

不同生物體(包括個體和物種)的基本組成零件其實很相近:人體內的蛋白質有99%可在小鼠體內找到對應的蛋白質,反之亦然;這些蛋白質也都保存在其他許多動物中,牽涉細胞基本功能的分子,在所有真核生物中更是少有變化。因此動物外觀的不同,基本上差異一定是來自與結構組裝有關的資訊。

蛋白質編碼基因顯然指定了組成生物的零件,那麼建築結構的資訊在哪裡呢?生物學家廣泛地假設,組裝複雜生物的指令,就隱藏在細胞內調控因子形成的各種組合內,也就是各種調節性蛋白質的排列組合,以及調節性蛋白質與DNA和RNA間的交互作用。然而美國塔弗茲大學的鄧奈特(Daniel C. Dennett)觀察到,雖然這樣可能產生幾乎無窮盡的組合,但絕大多數都是混亂而且沒有無意義,這在生物中是有問題的。所有生物在演化與發育時,都必須精確地遵循合理和具有競爭力的路徑,否則個體會死亡。產生複雜度很簡單,但要控制複雜度卻很困難,因為後者需要大量的調節資訊。

就直覺或機械性來考量,調控所需的資訊會隨基因數量增加,而呈現非線性函數成長(通常為二次方)。所以當系統變得越複雜,用在調節上的資訊比重也必須越高,這種調節與功能間的非線性關係,似乎是所有具完整組織系統的特色,因此所有這類系統的內在複雜程度,都會受限於它們控制結構的成長速度,除非(或直到)調節機制產生根本性的變革。

在原核生物中已發現的調節性蛋白質,其數目的確會與基因組大小的二次方成正相關,這和上述預測一致;另外,外插法的預測顯示,基因組中新調節分子的數目超過新功能性基因的數目,接近觀察到的細菌基因組大小的上限。

因此綜觀整個演化過程,原核生物的複雜程度,是受到遺傳調節物質有限所致,而不是一般假定的環境或生物化學因子。這個結論也與地球生物史上大部份時期都只有微生物的事實吻合。單靠各種組合的蛋白質間交互作用,是無法提升複雜程度的上限。

真核生物一定是找到了解決這個問題的辦法。邏輯推論和現有證據都顯示,10多億年前多細胞生物的興起,是因為出現了內建的數位化控制架構,而這個架構是以RNA為基礎。這理論可解釋前寒武紀大爆發的現象:大約在5億2500萬年前,地球上原本僅有的簡單生物,似乎突然間演化出許多無脊椎動物,其多樣性令人瞠目結舌。事實上,這些結果顯示了在生物學之外也通用的法則:組織的複雜度是調控性資訊的函數。而且,美國艾莫瑞大學的迦特(Marie E. Csete)和加州理工學院的多伊爾(John C. Doyle)也觀察到,幾乎所有的系統,都要有先進控制和嵌入式網絡,才能使複雜程度急遽增加。

這項法則蘊含了驚人的意義,我們可能完全誤解了遺傳程式的本質,也誤解了個體和物種間性狀差異的基礎。這項法則暗示,佔複雜生物基因組絕大部份的非編碼序列,絕對不是垃圾,它們具有功能,並且受到演化的篩選。

最新的意外發現指出,脊椎動物基因組中有數千個非編碼序列,在數百萬年的演化中幾乎完全沒有改變,這些序列保存得甚至比蛋白質編碼序列還要完好,這個現象完全出人意料。目前雖然不清楚這些序列沒有變化的機制,但它們極度的穩定性,說明它們涉及的複雜網絡,是生物中不可或缺的。因此,我們不應該將人類和其他複雜生物基因組中的蛋白質編碼序列,視為垃圾沙漠中的綠洲,而應該說蛋白質的零件資訊像是小島,位於調節資訊的汪洋大海中,而其中大部份的調節是靠RNA來傳達。

大規模RNA調節系統的存在,會影響藥理、藥物開發和遺傳篩檢的發展。傳統遺傳疾病,像是囊腫性纖維化(cystic fibrosis)和地中海型貧血症(thalassemia),是因零件嚴重缺損引起:某一特定蛋白質失去了功能。然而,人類大部份疾病的罹患率,以及每個個體的獨特性格,還有許多(就算不是大部份)遺傳差異,可能都與基因組中控制生長和發育的非編碼調節架構有關。目前已發現有多種病變與非編碼的RNA有關,其中包括B細胞淋巴瘤、肺癌、攝護腺癌、自閉症和精神分裂症。

這些缺陷並不容易從分子遺傳流行病學的研究中鑑定出來,也不容易醫治。但對這些調節系統的了解,最終可能是釐清人類生理與心理的個體特色,以及植物與動物性狀變異的關鍵;它還可以導引促進健康的尖端醫療策略,以及其他物種的基因工程研究。

除了插入子外,其他還有許多先前假設為垃圾的DNA,是由轉位子(transposon)和重複序列構成,約佔人類基因組40%。這些序列和插入子一樣,被視為在演化史不同時期一波波進駐到我們的基因組裡的分子寄生蟲。但就像所有的移民一樣,它們最初可能並不受歡迎,然而一旦在社區裡生根後,它們和它們的後代就會改變、做出貢獻並隨社會演變,逐漸成為社會動力的一部份。

現有的證據雖然還不完整,卻有力地支持轉位子對高等生物的演化和基因組調節的貢獻,以及它們在外遺傳(遺傳性狀的修飾)中可能扮演的關鍵角色。此外,今年7月,以色列的計算遺傳公司的李維儂(Erev Y. Levanon)和其他地方的同事,宣佈了一項令人興奮的發現,與RNA序列中特定位置的腺?(adenosine)轉成肌?(inosine)的「A變 I 編輯」(A to I editing)有關。他們證實,在轉錄子之中,A變 I 編輯在人類出現的機率,要比先前所預期的要高出數百倍;同時,在非編碼RNA序列中稱為Alu的重複性序列上,這種編輯的情形尤其頻繁。A變 I 編輯在腦部特別活躍,已知有多種行為異常現象與A變 I 編輯的異常有關,其中包括癲癇症和抑鬱症。

雖然所有動物多少都有RNA編輯,但Alu重複序列卻是靈長類動物獨有的。一個非常有趣的可能是,Alu片段在進入靈長類的基因組後,讓RNA處理的複雜度提升到新的層次,使得神經迴路程式變得更有彈性和活力。RNA調控系統這樣的多才多藝,可能是人類物種記憶出現和高層認知的基礎。

最後,了解複雜生物基因組中,繁複且高度精密的調節架構的運作,或許能啟發自我繁殖與自組程式的系統(也就是人工生物與人工智慧)。當初因為認識不多而被飭為垃圾的東西,反而可能握有人類複雜度的秘密,並可做為一般性複雜系統程式設計的指引。


# 關鍵字:編輯推薦生命科學
更多文章
活動推薦更多
追蹤科學人