在過去幾十年中,對噬菌體、病毒和原核生物基因組的研究取得了很大成就,由於生物界的普遍規律,這些成就對了解真核生物以至人類的基因結構和功能起了很大作用。但是,高等生物有其特殊規律性,其複雜性更是病毒或原核生物所無法比擬的。過去由於技術上的困難,致使這方麵的研究長期停留在細胞遺傳學的水平上。70年代中期以後,由於DNA重組技術和分子雜交等新技術的應用,使人們對真核生物乃至人類基因組的認識進入到分子水平。
第一節結構基因的分子結構
一、真核生物基因組
一個細胞內的全部遺傳信息都儲存在DNA分子上,構成了這個細胞的基因組。真核細胞基因組非常複雜,存在大量的重複順序。根據基因組中某特定堿基順序重複出現的頻度不同,把基因組DNA堿基順序分為高度重複順序,中等重複順序和單拷貝順序等。
(一)高度重複順序
DNA分子變性、複性研究表明,特定順序重複頻度越高則變性後的分子複性速度越快,以此可區分以上三種類型的順序。利用氯化密度梯度離心可將高度重複順序分離出來,稱之為衛星或隨體DNA,其順序長約5厘米,在一個基因組中可重複10厘米以上。運用標記核苷酸的染色體原位雜交技術表明,衛星主要分布於染色體的著絲粒區。在人類基因組中衛星DNA約占10%,其功能可能與減數分裂中同源染色體的配對有關。還有另一種形式的高度重複順序DNA散布於整個基因組,構成基因的間隔或維持染色體的結構。
(二)中等重複順序
中等重複順序人在人類基因組中約占12%,其順序長度為幾百至一千以上,在基因組中可重複102~105次。中等重複順序一般都具有種屬特異性,據此,可以用基因探針鑒別不同來源。
中等重複順序按結構特點可以分成許多家族,人類基因組中最引人注意的是家族,這個家族是含量最大的中等重複順序,占人類基因組的,順序長度約為30nm,拷貝數可達300,000以上,在整個基因組中散在分布。分子雜交技術證明,在人中含有大量的順序,說明DNA是可以轉錄的隻不過在八的加工過程中又被切除。順序的廣泛分布和具有在基因組中可移動的特點被認為在基因調控中發揮重要作用。
另一部分串聯重複的中等重複順序DNA為編碼組蛋白及免疫球蛋白的結構基因。
(三)單拷貝順序
單拷貝順序在人類基因組中約占60%~65%,是編碼蛋白質和酶的結構基因。另有一部分單拷貝順序由於堿基順序發生某些突變而失去功能,不能表達或表達異常的無生物活性的多肽,這種單拷貝順序稱為假基因。例如,研究發現各種動物基因組中有一部分珠蛋白基因是不編碼的,後來發現這些珠蛋白樣基因有廣泛的突變,以至影響了它的表達。現在仍不清楚假基因有何功能和生物學意義,也有的學者認為它們隻是進化的遺跡。假基因的發現叉為真核生物基因組的複雜性增添了一個新的內容。
根據以上對真核生物基因組的了解,人類基因組到底能夠編碼多少種蛋白質,目前還不能有明確的結論。從現有的遺傳學資料估計,大約是2萬至10萬之間因此,編碼蛋白質的結構基因占人類基因組總量應低於。
二、結構基因的分子結構
細胞內基因的種類很多,功能也不同。其中結構基因是決定合成各類生物功能分子。
(一)外顯子和內含子
真核生物基因組中編碼蛋白質的結構基因的最突出特點之一就是被插入順序所分隔。插入到結構基因內部的順序稱為內含子,內含子是不編碼的。有編碼作用的順序稱為外顯子。這樣,在一個結構基因中,編碼某一種多肽鏈的各個外顯子是不連續地排列在一起,被一個個長度不等的內含子分隔開,呈間斷形式,因此稱之為斷裂基因。結構基因轉錄時,這些外顯子和內含子屬一個轉錄單位,它們先轉錄在同一六前體中,再經轉錄後加工切去內含子順序,而將外顯子順序重新拚接在一起形成能指導蛋白質合成的成熟。其內含子數目和長度並無一定規律,一般說來內含子比外顯子長。
外顯子編碼氨基酸順序,內含子有什麼作用現在還不清楚,這是分遺傳學中一個引人注意的問題。目前認為,內含子增加了基因長度,使易於發生基因重組,從而增加了進化過程的適應性,另外大量內含子的存在為前體提供了多種拚接方式的可能性,即由於加工時拚接部位不同,致使同一八前體經拚接加工生成不同的成熟。
(二)側翼順序
結構基因的側翼序列是非編碼區,但是卻含有重要的調控順序。在人分子雙鏈中,鏈為編碼鏈,其上有基因調控順序;鏈是反編碼鏈,為轉錄合成的模板鏈。結構基因的側翼序列至少包含三個功能部位。
可以大大加強啟動子的效應。增強子一座長50~200如,這些08入順序無確定的位置,或存在於基因之內,或位於點動子的上遊或下遊。增強子的增效功能可以起雙向作用,即對其上遊和下遊的基因轉錄速率都論與進作用。增強子對增作用沒有專一性,如病毒的增強子也可以増強動物基因的轉錄活性。此外,增強子的增效作用具有組織特異性,如免疫球蛋白基因中的增強子僅對8細胞有作用,對纖維母細胞無作用。真核基因中存在增強子順序可能是一個比較普遍的現象,自首先發現於免疫球蛋白重鏈基因複體中後,新的增強子順序不斷被發現。
第二節基因的功能
基因是細胞內遺傳物質的功能單位,是由一定的核苷酸按特定的順序排列而成,核苷酸堿基順序本身便構成特殊的遺傳信息,並通過準確的自我複製,世代相傳,控製和影響新一代個體中特定性狀的發生和發育。基因的基本功能包括兩個方麵:第一是能準確地進行自的複製;第二是通過基因表達,控製細胞內蛋甶質和酶的合成,從而決定生物體的表型。
―、基因的複製
基因的複製是以人複製為基礎的。真核生物分子遠比原核生物DNA分子大,因此,真核生物的DNA複製有其特殊規律。
電鏡觀察發現,分子複製時可同時產生很多複製泡,這說明真核生物DNA複製時可同時形成很多複製起點,並且是以雙向複製的形式構成多個複製單位,稱為複製子。每個複製子大小不等,通常生長增殖快的細胞,複製子較短,活化的起始部位較多。而活化起始部位愈多人複製愈快,前期愈短。
複製開始時,在複製起始點處形成複製叉,然後由此向兩側推進進行雙向複製,隨著複製叉的延伸移動,每相鄰的兩個複製子的複製叉相接,當所有複製子的複製叉相接後,整個DNA分子的複製即告結束。
分子複製時,首先是在酶的作用下,DNA雙螺旋被解開,暴露出單鏈模板,然後按堿基互補原則互補合成一條新鏈。這樣,複製後的兩個DNA分子的堿基對順序與複製前的分子相同,而且每一個DNA分子含有一條舊鏈和一條新合成的鏈。DNA分子的這種複製方式被稱為半保留複製。
DNA複製時需要多種酶和蛋白因子的參與,其中最主要的是聚合酶。入聚合酶隻能催化多核苷酸鏈的延長,在原有鏈末端逐個加上核苷酸,而不能起始合成新鏈。聚合酶能起始新鏈合成,因而推測合成過程中,首先由人聚合酶催化合成一段RNA作為引物,後來這個推論得到了很多實驗的驗證。
聚合酶隻能催化在人鏈的3端加上脫氧核苷酸,所以新合成的DNA沿方向進行。在3—5模板鏈上,DNA可沿3方向連續複製,複製速度較快,叫前導鏈。其複製方向與複製叉前進方向一致。在5—3模板鏈上,複製過程要複雜一些。在真核生物中,這種片段長約100~200個堿基。當一個片段合成完畢後,引物才被除去,留下的缺口由DNA聚合酶催化片段的繼續延長反應來填補,最後由DNA連接酶將人片段連接起來,成為一條完整的長鏈。
二、基因的表達
結構基因的表達包括轉錄和翻譯兩步,是分別在不同時間和不同地點完成的。
(―)轉錄
基因的轉錄在細胞核中進行,首先在啟動子參與下準確選擇轉錄起始點並開始轉錄。轉錄是以人的編碼鏈為模板,在聚合酶作用下,以堿基互補配對原則合成RNA分子,增強子可以顯著增強基因轉錄的速率,最後在終止子參與下終止轉錄.轉錄初產物與DNA模板鏈脫離。基因轉錄的初產物為巨大的,不均的核內異質前體。六長度5000~50000個核音酸不等。它可含有5端前導順序與3端拖尾順序,還有外顯子與內含子。它的平均分子量比大10倍,要經過剪接、戴帽和加尾等加工過程,才能形成成熟的分子的這種轉錄後加工修飾是基因表達必需的過程之一,而且在基因表達的調控和細胞分化上起著重要作用。
剪接是指經酶的作用,切去不編碼的內含子,端不編碼的前導順序和3端不編碼的拖尾順序等部分,並把外顯子部分拚接起來。根據法則,由酶識別內含子接頭處的剪接信號,進行十分精確的拚接過程。剪接後的血RNA順序中,除頭、尾部以外,隻含有編碼作用的成分。拚接必須極為準確,稍有差錯就會導致遺傳信息傳遞障礙、合成的蛋白質就可能喪失其正常的生物學功能。
戴帽是指修飾過程。大多數真核生物的均有一特殊結構,這種結構特異的甲基化末端寡核苷酸稱為帽子結構。真核生物無這類帽子結構。
帽子結構並不在上編碼,而來自轉錄後修飾,即後加上去的。現已知有多種酶參與此修飾過程,這一加工過程與轉錄同時進行或轉錄起始後不久即進行。首先在端第一個核苷酸,之後在甲基轉移酶的作用下,在附加的上甲基化,同時在原來第一個核苷酸上也甲基化,這樣就形成了帽子結構。“帽子”不進行翻譯,但能被核糖體小亞基所識別而與之結合,並對以後的起始翻譯的準確性起重要作用;同時帽子結構有效地封閉,使之不被磷酸酶水解。
近來發現一個基因的原始轉錄物,可以由於不同剪接方式而產生多種八,編碼多種蛋白質,改變了過去一種基因,一種八,一種蛋白質的唯一概念。目前已發現幾十種編碼一種以上RNA的細胞基因和病毒基因,這樣的基因稱為複合轉錄單位。