教科書之外

優雅的錯

每一個複雜的問題都有一個清楚、簡單和錯誤的解答。—孟肯(H. L. Mencken,美國知名記者、文化評論家)

撰文/、插畫/陳文盛

教科書之外

優雅的錯

每一個複雜的問題都有一個清楚、簡單和錯誤的解答。—孟肯(H. L. Mencken,美國知名記者、文化評論家)

撰文/、插畫/陳文盛


克里克(Francis Crick)可說是分子生物學發展史上最重要的理論家。他喜歡高談闊論、拋出點子和人討論、不怕出醜,這樣的「大聲思考」是他很重要的動腦方式。1953年他和華生(James Watson)共同發現DNA雙螺旋結構,就是兩個人腦力激盪兩年的成果。


雙螺旋結構顯示遺傳訊息儲藏在鹼基序列中,經過轉譯變成蛋白質的胺基酸序列。DNA的鹼基有G、C、A、T(在RNA為U)四種,胺基酸則有20種之多。四種鹼基如何編碼20種胺基酸?這就像摩斯密碼如何用短線和長線兩種符號編碼26個字母,可看成編碼問題。


最根本的問題是編碼胺基酸的鹼基序列(稱為密碼子)的長度。密碼子顯然不可能是單一鹼基,因為這樣只能編碼四種胺基酸。如果密碼子的長度是兩個鹼基(二聯體),就會有16(42)種密碼子,最多也只能編碼16種胺基酸。所以當時大部份科學家認為密碼子應該有三個鹼基(三聯體)。但三聯體的密碼子共有64(43)種,比胺基酸種類多出44種。多出的44種密碼子如何處置?或許有些三聯體不編碼胺基酸(無意義)?或許有些密碼子會編碼同一種胺基酸?


這些都是當時嘗試解開遺傳編碼的科學家(包括物理學家和數學家)面臨的問題。很多人從純理論的角度提出各式編碼模型,但都沒有具體的實驗支持。當時還沒有核酸定序的技術,只有蛋白質可以定序(速度很慢),這些有限的蛋白質序列可以用來檢驗編碼模型。和已知序列矛盾的模型,可以排除;沒有和已知序列矛盾的模型,日後也被其他實驗淘汰,全部煙消雲散。


優雅但是錯誤


思考遺傳編碼的另一個問題是:不管密碼子是二聯體或三聯體,它們是如何排列在DNA連續的鹼基序列上?以三聯體密碼子為例,任何一個序列都有三個讀法。我們用1、2、3代表鹼基序列的三個相對位置:123123...。三種讀法分別是:123, 123...;231, 231...;和312, 312...。這些不同的讀法稱為「讀框」。科學家的問題是細胞如何選擇讀框,套句克里克的話:「細胞如何知道逗點要放在哪裡呢?」


1955年克里克在同僚通訊中提出一個假說:三種讀框可能只有一種有意義(編碼蛋白質),另外兩種是無意義的。有意義的讀框其密碼子都有對應的胺基酸,無意義讀框的所有密碼子則否。以AGACGAUUAUC...這個序列為例,如果第一種讀框有意義,其中的密碼子AGA, CGA, UUA...就都有意義;另外兩種讀框GAC, GAU, UAU...和ACG, AUU, AUC...的密碼子都無意義。克里克稱這假說為「無逗點密碼」,因為不需要逗點。


「無逗點密碼」最吸引人的地方是,它推論出有意義的密碼子數目剛好是20。怎麼會呢?我們考慮簡單的UUUUU...序列,它三種讀框的密碼子都是UUU,不可能一種有意義、兩種無意義,所以UUU一定是無意義;同理,CCC、AAA和GGG也都是無意義。剩下的60個密碼子,每三個循環序列(例如GCAGCAGCA...中的GCA/CAG/AGC)只有一種可以是有意義,其他三聯體循環也是如此,60除以3,就得到20個有意義的密碼子(讀者可以在紙上操練一下)。


雖然沒有實驗支持,但也沒有實驗駁斥它,無逗點密碼很快就成為解碼圈的寵兒,因為它用一個非常簡單的假設一次解決了讀框選擇的問題,以及用64個密碼子編碼20個胺基酸的問題。但四年後,這個假說就被試管中的解碼實驗推翻了。這個實驗顯示一連串UUUUUU...序列的RNA,可製造出蛋白質多苯丙胺酸,亦即UUU不是無意義,它編碼苯丙胺酸。


後續的實驗成功解出整個遺傳編碼,吹倒所有理論派的紙牌屋,包括無逗點密碼假說。歷史學家賈德森(Horace F. Judson)在《創世第八天》中寫道:「大自然並沒有克里克想像得優雅。」克里克自己也說:「無逗點密碼……一個優美的解答,依據非常簡單的假設,但是完全錯誤。」他認為,「有一、兩個這樣的例子當做警惕,總是好的。」


悲觀卻是正確


這期間,在英國劍橋的克里克還提出另一個編碼假說。他說他無法想像胺基酸可以直接在DNA或RNA分子上排列,根據鹼基序列組成蛋白質,他認為RNA序列與鹼基序列之間應該有一個特殊的小分子當媒介,他稱之為「轉接器」。這些轉接器一端以氫鍵和RNA上的密碼子配對,另一端則連接特定的胺基酸。不同轉接器連接不同的胺基酸,和RNA上的鹼基序列配對排列起來,就連結成蛋白質。根據這個假說,細胞至少要有20種不同的轉接器來對應20種胺基酸;還要有20種不同的酶,分別把胺基酸置放到這些轉接器上。


克里克說,他是懷著悲觀的心情提出這個假說,因為這個假說若正確,當時熱烈進行的理論都將白費心血。根據這假說,編碼的關鍵在於轉接器與胺基酸的搭配;這個搭配決定哪個密碼子編碼哪個胺基酸。例如:UUU之所以編碼苯丙胺酸,是因為與UUU配對的轉接器上接的就是苯丙胺酸。轉接器與胺基酸的搭配,應該只是演化中隨機變異與天擇的結果。這表示遺傳編碼並沒有什麼章法可循,遺傳編碼沒有章法,走理論路線解碼就毫無希望。


克里克認為轉接器不算是好假說,因為沒有指出如何以實驗測試。不過在幸運女神的眷顧下,當轉接器假說只在同僚之間流傳的時候,美國哈佛大學研究RNA和蛋白質合成的薩梅尼克(Paul Zamecnik)與霍格蘭(Mahlon Hoagland)1956年的一個實驗,意外提供了證據。他們在合成RNA的試管中加入放射性胺基酸當做負面的對照組,因為胺基酸應該不會合成RNA;但他們發現這些胺基酸竟然也連接到小分子的RNA上。他們把攜帶這胺基酸的RNA放入合成蛋白質的試管中,胺基酸居然脫離RNA,跑進新合成的蛋白質中。


這是怎麼回事?薩梅尼克和霍格蘭無法解釋。這時候華生碰巧來訪,聽到此事,就想到這小RNA不就是克里克所說的轉接器嗎?薩梅尼克和霍格蘭都沒聽過轉接器假說,而且自己的研究結果居然要靠他人來詮釋,他們感到尷尬。但華生是對的,克里克的轉接器就這樣誤打誤撞被證實了。這些小RNA就是我們所稱的「轉送RNA」(tRNA)。tRNA一端接胺基酸,另一端有三聯體的「反密碼子」鹼基序列,可以和相對應的密碼子配對。科學界也發現各種細胞都至少有20種tRNA,還有20種不同的酶分別把各種胺基酸放到tRNA上。tRNA可以說是遺傳編碼的翻譯者,溝通了核酸和蛋白質兩種語言。


克里克曾說:「一個好的理論不只要做預測,還要是令人驚異又能證明是正確的預測。」本文提及的克里克的三個理論都令人驚異:DNA雙螺旋模型既優雅又正確;無逗點密碼假說非常優雅,但是錯誤;轉接器假說不優雅,但是正確。在分子生物學的核心原理中,克里克三次打擊,兩次全壘打,無人能出其右。


科學家常常過份看重科學理論的簡潔優雅,認為正確的理論常常具有這樣的特質,例如牛頓力學第二定律f=ma、愛因斯坦質能等價公式E=mc2。克里克晚年反省,認為很難在生物學中找到優雅的原理。物理學原理適用於任何時空,生物學則否。火星上如果有生物,它們的原理會跟地球上的很不一樣,生物是數十億年來經過盲目變異,接受不同環境天擇的歷史產物。生物學中除了貫穿整個演化史的DNA雙螺旋,後來隨機發展並堆砌的機制和原理,應該都無法保持優雅的姿態。