生命演化的過程曲折神妙, 可以看做是過一條湍急的河流. 生命並不知道如何過河, 就只能摸著石頭過河. 過河之後, 開始放置指標, 告訴後來者, 哪裡水深哪裡水淺, 哪裡水急哪裡水緩, 哪裡有漩渦哪裡有依靠. 然後開始拉引導繩索; 然後拉輔助繩索; 然後拉支撐繩索; 然後拉繩索橋; 然後建獨木橋; 然後建鐵橋; 然後建水泥橋; 然後建金門大橋. 當建置了水泥橋, 金門大橋後, 因為種種原因, 生命就不再能夠摸著石頭過河了. 生命的演化, 很難從頭再來一遍. 今日生物學上認定, 若非細胞傳細胞, 生命根本無法延續, 細胞是生命傳延最基本的單位. 那麼, 到底細胞傳承間, 傳遞了什麼不可或缺的, 從原始漸漸演化而來, 無法再重新創造的生命力呢?
我們詳細的來看看細胞繼承了哪些生命重要因子, 以及如何能夠傳延下去. 在真核細胞有絲分裂過程, 以及有性生殖的受精過程中, 子細胞從母細胞那兒繼承了哪些性狀內容? 只有基因的密碼排列嗎? 基因密碼是遺傳過程傳遞的唯一資訊並且遺傳穩定性極高嗎? 還是還有其他東西或狀況, 被我們忽略了呢?
在討論正題之先, 我們做幾個名詞定義的討論, 這是有必要的工作. 確認我們討論的是同一個東西, 不是使用同一名詞, 卻代表不同內涵.
[遺傳], 是生命能力/生命現象之一, 不是唯一. 既非充分, 也非必要條件. 因此,遺傳訊息, 是生命訊息的一種.
[訊息], 可以有各種形式的表達方式, 包括: 語意, 圖形, 符號, 結構, 連結, 程序, 對應, 等, 都是訊息的表達形式.
[生命訊息], 生命為了維持生存所必需擁有的能力, 以各種形式的表達內容.
[遺傳訊息], 是生命由親代傳承到子代, 所傳遞給予的相關生命訊息. 有此, 生命得以繼續存在. 其中包含「為了維持生存所必需擁有的能力, 訴諸於任何形式, 任何載體, 任何符號所表達的內容.」
假設1: 而在地球目前的生物學中, 細胞是生命最基本的載體與形式; 生命傳延由細胞分裂來. 遺傳訊息, 是細胞由親代傳承到子代, 所傳遞的生命訊息. 其他非細胞結構的活動力, 暫時不考慮其生命的可能性.
我們以此為討論基礎.
我們在建構生命模型時, 還有一點要注意. 在摸著石頭過河的模型中, 還有一個隱因素, 就是「過河」是這項行動的目的, 這個隱因素其實非常重要. 那麼, 生命為什麼要過河呢? 1.傳延生命, 讓生命之火能夠不斷傳延下去; 還是2.存活下去, 讓生命本身能夠天長地久; 或者是3.當下自是(適)(I AM), 生命就是自在的存活於此時此地. 這是建構生命模型的哲學基礎, 不同的哲學假設, 會建構出不同的生命模型.
一般我們所謂基因密碼, 指的是鹼基對的配對與排列: ATGC四個字母的長長排列, 構成獨特的生物個體基因訊息. 這是子細胞從母細胞繼承的第1種重要資訊: 基因編碼. 由基因編碼決定20種胺基酸序列, 例如: 三聯碼GGA對應甘胺酸, CT(U)A對應白胺酸, TT(UU)C對應苯丙胺酸, ATG對應甲硫胺酸, TGA對應色胺酸等, 64個三聯碼對應20種胺基酸(密碼退化degeneracy), 再由編碼序列決定胺基酸序列, 因而決定蛋白質種類和結構. 關於這種對應的內容和過程, 在細胞內完成是非常複雜, 筆者還有點話要補充說說. 如上簡化的說編碼對應, 對於病毒和細菌或許是正確的. 不過, 真核細胞的DNA編碼結構就複雜多了. 真核DNA大致分成三大群: 1.高度重複片段, 2.中度重複片段, 3.非重複片段. 非重複片段為標準基因序列, 可轉譯絕大部分的蛋白質, 即簡單細菌所擁有的編碼對應, 也是我們目前認為最重要的遺傳訊息. 約佔人類DNA的70%. 高度重複片段, 約佔脊椎動物DNA的10%. 又分為衛星DNA群, 小衛星DNA群, 微衛星DNA群. 在DNA編碼中, 他們幾乎不轉譯蛋白質. 有什麼功能, 生物學家仍然不知. 推斷可能跟突變有關或與鄰近基因的表現有關. 中度重複片段, 依不同物種, 佔DNA的比例20~80%不等. 又分為有轉錄功能和無轉錄功能. 有轉錄功能者, 轉錄tRNA和rRNA, 還有轉譯染色體的組織蛋白histones. 無轉錄功能者大部分是分散的, 他的來源非常奧妙, 值得多說些些近代研究的發現. DNA基因編碼是遺傳物質, 生物學開始時認為他應該是非常穩定的分子, 在染色體上排列成串, 他所含的訊息, 不論是親代傳子代, 或者是個體本身內部, 都是維持不變. 在整個演化過程中, 應該是非常緩慢的改變. 其實不然. 近代發現基因體的穩定性, 有許多現象超出我們的預期. 首先, 1991年發現一種動態突變, 經常發生在一代之間的突變現象, 幾乎到了正常突變的行為. 基因中三核苷酸(如CCG)單元, 有重複排列現象, 如CCGCCGCCG… 在大部分基因族群中, 含有相對少數的重複, 這在傳遞過程中, 不會有太大改變. 不過有少數基因族群, 含有較多的三核苷酸重複排列, 比方說15或20次連續重複, 這種對偶基因就非常不穩定. 在傳遞過程中, 他傾向增加重複單元. 這增加傾向, 會是因為DNA聚合酶的特質影響嗎? 當重複的數目超過一個極限時, 就會變成嚴重的遺傳疾病. 這應該是蛋白質折疊出現問題, 是蛋白質的一級結構引發三級四級結構的大變化所造成. 其次, 是一個基因可能由3個表現區exons(密碼區)和2個插入區introns(非密碼區)構成, 而在演化速度上, 兩者具備可觀察的差異性. 密碼區具高度穩定性, 而非密碼區變異較多且常是片段的插入或丟失. 同樣是鹼基編碼, 為什麼會有這種差別? 這又是什麼原因造成? 第三, 可移動的跳躍基因. 這是1948年Barbara研究玉米果仁, 發現基因會從染色體一處移動到完全無關的另一處, 他稱這種重新排列為移位transposition, 可移動的遺傳單元為跳躍基因transposable elements. 不過, 被當時的生物學家所忽略, 這是多麼令人沮喪的事. 到1960年代晚期, 生物學家在細菌中發現, 某些DNA序列能從基因體一處移動到另一處, 這種跳躍的基因被稱為跳躍子transposon. 隨後發現, 跳躍子能夠轉譯出一種蛋白質稱移位酶transposase, 他能從原DNA切出跳躍子, 插入標的DNA中. 這種切補機制, 後來被研究完全了解. 而跳躍子的序列端會重複並反向出現在另一端(GGGGTCTG→CAGACCCC)inverted repeat, 這些末端重複序列會被移位酶辨認出來. 末端重複序列, 被發現在所有的跳躍基因末端, 包括細菌和真核細胞. 並且, 當跳躍子插入標的DNA中時, 會複製一小段標的DNA序列於跳躍子兩端. 這發現不得了, 蛋白質(移位酶)可以重建, 黏貼或創造新的DNA序列, 雖然不是真正由蛋白質創造新編碼, 卻已經翻轉原始遺傳定則, 震動了生物學界. 也就是說, 掌控DNA編碼序列的遺傳因素, 除了複製和突變機率外, 還有另外一種力量介入. 研究者發現真核細胞含有大量跳躍基因. 很不可思議的是, 研究發現, 跳躍基因改變位置時, 幾乎是隨機[註]插入標的DNA, 經常可能插入表現蛋白質的基因中. 很多血友病案例, 就是由跳躍基因, 插入重要凝血基因而引起. 研究估計, 大約每500個基因突變, 就有一個是由跳躍基因引起. 我們當了解, 跳躍基因是早在細菌階段, 就已擁有的DNA特質, 是很古老的演化能力/機制. 第四, 真核細胞的跳躍基因, 有許多不同的形態和移位機制. 有「基因不複製」的跳躍(給予DNA會失去跳躍子), 有「基因直接複製兩付」後的跳躍, 還有「基因轉錄出RNA再反轉錄DNA與雙股」後的跳躍(後兩種給予DNA會保留跳躍子). 這第三種經由RNA反轉錄過程, 是真核細胞最常出現的移位方式. 許多跳躍基因很可能自己就含有一段DNA序列可以轉譯出反轉錄酶. 這種經由RNA過程需要反轉錄酶的跳躍基因, 稱為反轉錄跳躍子retrotransposons.
在演化上, 反轉錄病毒被認為是從反轉錄跳躍子演化而來; 反過來說, 反轉錄病毒也可能侵入細胞變成反轉錄跳躍子. 第五, 大部分中度重複片段是由移位作用造成. 在人類基因中, 最常出現的兩種中度重複片段就是跳躍子: Alu和L1家族, 都是經由RNA過程進行移位. 完整的L1序列全長約6000個鹼基對, 能轉譯出反轉錄酶和內核酸酶endonuclease, 具切開標的DNA的功能. Alu較小卻更普遍, 大約300個鹼基對, 和核醣體的7S RNA非常類似. 生物學家認為可能原因是7S RNA被反轉錄酶做成單股DNA, 再插入基因體中. Alu普遍存在於靈長目基因中, 卻不普遍於其他哺乳綱, 很明顯是晚期演化產物. 第六, 跳躍基因的功能是什麼? 一般生物學者認為是垃圾, 是演化過程中外來的基因寄生物. 他們只是跟著繁殖, 對宿主的危害不大. 消耗一些生命能量, 偶而產生致命疾病. 只是, 寄生久了, 在演化過程中很可能被納入使用, 由寄生轉為共生. 以下是生物學家猜測他被細胞使用的方向. 第七, 1調節. 生物學家發現, 跳躍基因DNA序列是調節區域的重要部分, 很可能跳躍基因的殘骸被併入調節區以新的功能運用. 2協助組合新基因. 當跳躍基因移動時, 會攜帶部分鄰近的DNA序列一起移動. 偶而造成原本不相關的片段被排在一起, 形成一種全新組合片段, 產生兩片段組合成新的蛋白質. 3抗體基因需要有重組和變化的能力, 這能力由酵素(酶)輔助完成, 而其來源很可能是一種跳躍基因的移位酶. 也就是說, 我們的免疫能力, 很可能是來自跳躍基因. 這是一種非常成功的功能演化. 4改變基因組成, 產生新基因. 這點在果蠅身上獲得驗證. 小結: 幾十年前, 生物學家認為基因體是遺傳物質穩定的寶庫. 現在的了解, 生物體必須每天都努力維持他的穩定度. Barbara因發現移位作用這個革命性的發現, 獲得1983年諾貝爾獎. 當年的沮喪, 35年後終於獲得補償. 好, 以上, 論述基因密碼的遺傳穩定性. 除了基因編碼外, 還有其他什麼東西被細胞傳承了嗎? 有, 結構!!
第2是, 基因雙螺旋結構, 雙股聚核苷酸鏈: 五碳醣+磷酸根+鹼基. 聚核苷酸鏈靠磷酸雙酯鍵連結成聚合鏈; 雙股依靠鹼基氫鍵結合; 螺旋狀則依靠核苷酸整體的三維結構(三級結構)形成. 這是基因密碼能形成的基礎, 卻不是基因密碼本身.如果研究基因只看到密碼, 而忽視基因雙螺旋結構這基礎, 那麼, 密碼排列, 將失去支持的根柢結構. 身為基因主義論者一定了解, 1953年華生克里克提出的模型, 最重要的貢獻就是雙螺旋長鏈結構, 是DNA結構, 而非基因密碼所帶的資訊. 直要到10年後的1965年左右, 胺基酸的密碼子對應, 才被解出. 各種基因體的長串密碼, 當然在這之後才陸續被解出來.
當然, 基因主義論者可以宣稱基因密碼和雙螺旋結構都是基因所傳遞的資訊, 都是因為DNA而遺傳下來的. 這點我們不予否認, 同意這是基因資訊, 不論是排列密碼或雙螺旋結構, 都屬於基因遺傳資訊. 我們提出, 主要用意只是在提醒: 基因資訊至少包括兩大部分: 一是遺傳密碼; 一是基因結構. 別只把注意力放在遺傳密碼上, 而忽略了這個1953年最重要的貢獻所在: 結構. 若不計比重, 簡單一分二, 遺傳密碼占1/2的內容, 基因結構占1/2的內容. 好的, 還有嗎? 有, 然後, 是程序.
第3是, 雙股聚核苷酸鏈結構+鹼基密碼, 有被切開, 被複製, 被再結合的能力. 這種「被複製」是一種程序, 非常複雜的細胞程序. 其中牽涉到扭轉酶gyrase, 解旋(蛋白)酶helicase, 單股結合蛋白SSB, RNA引子primer, 引發酶primase, 聚合酶polymerase. 有這麼多蛋白酶參與, 其複雜度可想而知, 不在此詳述. 此複製程序, 也被繼承. 複製程序中, 基因(鹼基密碼)是被動者, 蛋白酶是主動者.
第4是, 轉碼系統. 由DNA密碼排列, 到mRNA的轉錄, 再到tRNA連結胺基酸的轉譯, 二大程序. 這個轉碼對應在tRNA完成. 密碼與胺基酸的配對, 這個被稱為轉譯的工程, tRNA(應該說胺醯tRNA合成酶)是關鍵, 由tRNA(應該說胺醯tRNA合成酶)完成. 這是一種沒有規則(後來生物學家發現深層規則由胺醯tRNA合成酶的三級結構所決定)的函數關係, 硬性指定(後來演化學家了解三聯體密碼可能具有內在意義), 被tRNA結構攔腰分開與完成. 這個轉碼, 沒有原理限制, 就是一種對應, 可以有很多種可能性. 卻在生命演化過程的早期, 被某群tRNA的結構所固定了. 這個轉碼系統, 也被繼承. 其中從轉錄到轉譯, 也是一個非常複雜的程序, 不亞於基因複製, 甚至有過之. 所以是, 這個轉碼系統和這個轉碼程序, 也被繼承.
好, 以上四點: 密碼, 結構, 程序, 轉碼配對系統, 子細胞都從母細胞繼承下來了~
一二點為基因性狀, 三四點為基因+蛋白質性狀, 基因是被動者, 蛋白酶是主動者. 若要將他全部歸於基因的貢獻, 在學界是有相當大的爭議性. 我們姑且把這爭議放下, 全部歸於基因的貢獻, 也暫時不予否認. 重點是, 了解遺傳繼承的性狀, 至少包括這四點: 密碼, 結構, 程序, 轉碼配對系統. 若不計比重, 基因密碼, 只占了1/4.
[註] “幾乎是隨機插入標的DNA”, 這種陳述方式, 是我們目前把不了解的事情, 都歸於隨機性. 因為不了解來龍去脈, 不了解因果. 或許跳躍基因這種位移, 看似隨機插入標的DNA的行動, 可能是要補償或滿足某些量子生物條件, 或是滿足耗散混沌結構的條件, 這都是目前尚不完全了解的領域. 所以暫時以隨機性認定.
