Southern雜交是分子生物學的經典試驗方法。其基本原理是將待檢測的DNA樣品固定在固相載體上,與標記的核酸探針進行雜交,在與探針有同源序列的固相DNA的位置上顯示出雜交信號。該技術在1975年由英國愛丁堡大學的E.M.Southern首創,Southern印跡雜交故因此得名。通過Southern雜交可以判斷被檢測的DNA樣品中是否有與探針同源的片段以及該片段的長度,從而進行基因的酶切圖譜分析(限製性片段長度多態性分析,RFLP)、基因組中某一基因的定性及定量分析和基因突變分析等。Southern印跡雜交技術包括三個主要過程:一是將待測定核酸分子通過一定的方法轉移並結合到一定的固相支持物(硝酸纖維素膜或尼龍膜)上,即印跡(blotting);二是固定於膜上的核酸與標記的探針在一定的溫度和離子強度下退火,即分子雜交過程;三是雜交信號燈檢測,可針對探針分子所攜帶的同位素標記或非同位素標記采用相應的方法進行檢測,如對放射性標記探針進行的放射自顯影分析。

2.7.1.1Southern雜交技術流程

Southern雜交技術的簡要操作流程如圖260所示。

圖260Southern雜交的操作流程

(1) 基因組DNA的提取。

(2) 基因組DNA的酶切。選用合適的限製性內切酶進行基因組DNA的酶切。

根據實驗目的決定酶切DNA的量。一般Southern雜交每一個電泳通道需要10~30μgDNA。為保證酶切完全,一般用2U~4U的酶酶切1μg的DNA。酶切的DNA濃度不宜太高,以0.5μg·μL-1為好。在最適溫度下酶切1h~3h,酶切結束時可取5μL電泳檢測酶切效果。如果酶切效果不好,可以延長酶切時間,但勿超過6h。也可通過放大反應體積或補充酶再酶切來解決。如仍不能奏效,可能的原因是DNA樣品中有太多的雜質,或酶的活力下降。

(3) 基因組DNA消化產物的瓊脂糖凝膠電泳。

一般用於Southern雜交的瓊脂糖凝膠濃度為0.8%,分離範圍廣,可從200bp~50kb。 酶切完全的正常電泳圖譜呈現一連續均勻的條帶(圖260)。

(4) DNA從瓊脂糖凝膠轉移到固相支持物。

將瓊脂糖凝膠中的DNA轉移到硝酸纖維素膜(NC膜)或尼龍膜上,形成固相DNA,這一過程又稱為印跡(blotting)。常用的印跡方法有毛細管虹吸法、真空法和電轉移法。轉移到固相支持物上的DNA為單鏈分子,所以要在轉移前對凝膠中的DNA進行變性處理,即堿變性,而後還需要將凝膠中和處理,最後才進行轉膜。下麵就毛細管虹吸轉膜法進行介紹。

① 堿變性:室溫下將凝膠浸入數倍體積的變性液(0.5mol·L-1 NaOH、1.5mol·L-1NaCl)中30min。

② 中和:將凝膠轉移到中和液[1mol·L-1TrisHCl(pH 7.4)、1.5mol·L-1NaCl]15min。

③ 轉移:按凝膠的大小剪裁硝酸纖維(NC)膜或尼龍膜並剪去一角作為標記,水浸濕後,浸入轉移液中5min。剪一張比膜稍寬的長條Whatman 3mm濾紙作為鹽橋,再按凝膠的尺寸剪 3~5 張濾紙和大量的紙巾備用。轉移裝置由下到上的設置順序依次為鹽橋、凝膠NC膜\/尼龍膜、多層濾紙、大量紙巾、玻璃板和約1kg重物(圖261)。轉移液用20×SSC(3.0mol·L-1NaCl、0.3mol·L-1檸檬酸鈉)。注意在膜與膠之間不能有氣泡且避免濾紙和鹽橋之間直接接觸造成短路。轉移過程大概需要8~24h,每隔數小時換掉已經濕潤的紙巾。整個操作過程中要防止膜上沾染其他汙物。

圖261毛細管虹吸法轉膜裝置示意圖

轉移結束後取出膜,浸入6×SSC溶液數分鍾,洗去膜上沾染的凝膠顆粒,置於兩張濾紙之間,80℃烘2h或紫外光照射20min,將單鏈DNA交聯在膜上。然後將NC膜夾在兩層濾紙間,於幹燥處備用。

(5) 探針標記(後文詳述)。

(6) 雜交。

Southern雜交一般采取的是液—固雜交方式,即探針為液相,被雜交DNA為固相。雜交發生於一定條件的雜交液中並需要一定的溫度,可以用雜交瓶或雜交袋並使液體不斷地在膜上流動。

整體上分為預雜交和雜交兩個過程。預雜交為使用不含探針的雜交液(含有魚鮭精DNA)封閉膜上沒有DNA轉移的位點,降低雜交背景,提高雜交特異性。之後在雜交液中加入經加熱變性的探針,42℃雜交過夜。

(7) 洗膜和雜交信號檢測。

洗膜的目的是洗去結合的非特異探針,根據探針和目標靶序列的結合強度選擇適合的洗膜液鹽離子濃度和溫度進行洗膜,以期獲得特異的雜交信號。信號的檢測方法以探針標記的不同而有異。針對探針的不同標記類型來選擇相應的檢測方法,如進行放射自顯影檢測、化學發光或顯色進行信號的檢測。如果是同位素標記,可選擇放射自顯影方法。放射自顯影即利用放射性粒子可使照相乳膠和軟片感光的原理,對標本中放射性分子進行定位的技術。放射性同位素在衰變過程中產生的α粒子和β粒子能和可見光一樣使乳膠感光。乳膠同標本接觸後,放射性物質存在的部位溴化銀膠體被還原,產生銀粒子沉澱,從而顯示出放射性物質存在的部位。如果采用了地高辛或生物素標記,可選用抗地高辛或生物素的抗體分子進行雜交信號的檢測。這類抗體分子一般偶聯辣根過氧化物酶(HRP)和堿性磷酸酶(AP),通過AP或HRP催化底物(NBT\/BCIP,AP的生色底物;CDPStar,AP的化學發光底物)顯色或發光的原理進行雜交信號的檢測。

2.7.1.2探針的合成、標記

1. 探針的定義和種類

探針是帶有特定可被檢測標記的已知序列的DNA片段或寡核苷酸片段。分子雜交基因探針根據標記方法不同可粗分為放射性探針和非放射性探針兩大類;根據探針的核酸性質不同又可分為DNA探針、RNA探針、cDNA探針、cRNA探針及寡核苷酸探針等幾類,DNA探針還有單鏈和雙鏈之分。雙鏈DNA探針在雜交前要經變性處理。放射性標記為放射性同位素標記,常用32P進行標記;非放射性標記有地高辛和生物素標記,兩者標記上偶聯有特定的生色酶,如堿性磷酸酶或熒光基團。放射性標記靈敏度高,效果好。地高辛標記沒有半衰期,安全性好。

探針的標記方法很多,大致可以分為兩大類:引入法和化學修飾法。引入法是運用標記好的核苷酸來合成探針,即先將標記物與核苷酸結合,然後通過DNA聚合酶、RNA聚合酶及末端轉移酶等將標記的核苷酸整合入DNA或RNA探針序列中去。化學修飾法即采用化學方法將標記物摻入已合成的探針分子中去,或改變探針原有的結構,使之產生特定的化學基團。引入法較化學修飾法更常用。常用的引入類探針標記的方法有PCR合成方法、隨機引物法、切口平移法、末端標記法和RNA體外轉錄方法。

2. PCR合成探針

PCR合成探針的方法和普通PCR方法基本相同,但是PCR體係中除了普通的dNTP底物外,還有帶放射性或非放射性標記的dNTP,如DIG11dUTP或α32PdCTP。在PCR擴增過程中,DIG11dUTP或α32PdCTP可摻入到擴增出的DNA產物中。PCR擴增產物即為標記好的探針。

3. 隨機引物法探針標記

隨機引物法的原理是使用被稱為隨機引物(random primer)的長為6個核苷酸的寡核苷酸片段N6與單鏈DNA或變性的雙鏈DNA隨機互補結合(退火),以提供3′—OH端,在無 5′→3′ 外切酶活性的DNA聚合酶大片段(如Klenow片段)作用下,在引物的3′—OH末端逐個加上核苷酸直至下一個引物。當反應液中含有標記的核苷酸時,即形成標記的DNA探針。6核苷酸隨機引物混合物出現所有可能結合序列,引物與模板的結合以一種隨機的方式發生,標記均勻跨越DNA全長(圖262)。當以RNA為模板時,必須采用反轉錄酶,得到的產物是標記的單鏈cDNA探針。隨機引物法標記的探針比活性高,但標記探針的產量比缺口平移法低。

圖262隨機引物法探針標記示意圖

4. 缺口平移法

缺口平移法(nick translation)是一種最常用的標記雙鏈DNA探針的方法之一,該方法利用DNA聚合酶Ⅰ的多種酶促活性將標記的三磷酸脫氧核糖核苷(dNTP)摻入到新合成的DNA鏈中,從而合成高比活性的均勻標記的DNA探針。其基本原理是首先用適當濃度的DNA酶Ⅰ在DNA分子的一條鏈上打開缺口(nick),缺口處形成3′—OH末端;利用大腸杆菌DNA聚合酶Ⅰ 5′→3′方向外切酶活性,將缺口處5′端核苷酸依次切除;與此同時,在大腸杆菌DNA聚合酶Ⅰ的5′→3′聚合酶活性的催化下,以另一條DNA鏈為模板,以dNTP為原料,依次將dNTP連接到切口的3′—OH上,從5′端向3′端方向重新合成一條互補鏈(圖263)。其結果是在缺口的5′端核苷酸不斷被水解,而在缺口的3′端核苷酸依次被添加上去,從而使缺口沿著互補DNA鏈移動,原料中含有的標記核苷酸因此替代原DNA分子上的部分核苷酸而摻入到新合成的DNA鏈中,從而獲得標記的DNA探針。此方法的缺點是需要較多的DNA模板(>200ng),且標記效率較低。

圖263缺口平移法探針標記示意圖

5. 末端標記法

末端標記法是在大腸杆菌T4噬菌體多聚核苷酸激酶(T4PNK)的催化下,將γ32PATP上的磷酸連接到寡核苷酸的末端上(圖264)。要求標記的寡核苷酸5′端必須帶羥基,此法適用於標記合成的寡核苷酸探針。

圖264末端標記法探針標記示意圖

6. RNA探針的體外轉錄合成

近幾年體外轉錄技術不斷完善,已相繼建立了單向和雙向體外轉錄係統。該係統主要基於一類在多克隆位點兩側分別帶有SP6啟動子和T7啟動子的載體,如pGEMT載體(見第3章)。SP6 RNA聚合酶或T7 RNA聚合酶分別結合相應啟動子,可以驅動啟動子下遊基因轉錄生產mRNA。如果在多克隆位點接頭中插入了外源DNA片段,選用不同的RNA聚合酶,可以控製RNA的轉錄方向,即可以選定的DNA鏈以模板轉錄RNA(圖265)。這種可以得到同義RNA探針(與mRNA同序列)和反義RNA探針(與mRNA互補)。這種體外轉錄反應效率很高,在1h內可合成近10μg的RNA,隻要在底物中加入適量的放射性或生物素標記的NTP,則所合成的RNA可得到高效標記。該方法能有效地控製探針的長度,並且可以提高標記物的利用率。

圖265RNA探針體外標記所用載體示意圖

其他分子雜交技術和Southern雜交技術有著相似的操作流程,隻在特定的操作步驟有差異。下麵簡要敘述如下。

2.7.2Northern印跡雜交

RNA印跡技術正好與DNA相對應,故被稱為Northern印跡雜交(Northern blotting),用於檢測樣品中特定RNA分子的大小和表達豐度。Northern印跡雜交的流程與Southern雜交基本類似,隻是進行甲醛變性電泳,因RNA為單鏈,無需對凝膠進行處理。雜交所用探針可以是RNA探針,也可以是DNA探針。

2.7.3菌落原位雜交(Colony in situ hybridization)

將細菌從培養平板轉移到硝酸纖維素濾膜上,然後將濾膜上的菌落裂解以釋放出DNA,再烘幹固定DNA於膜上,與標記的探針雜交,放射自顯影或其他方法檢測菌落雜交信號,並與平板上的菌落對位(圖266)。這一方法常用於從基因組或cDNA文庫中篩選含有特定基因序列的克隆。

圖266菌落原位雜交流程示意圖

2.7.4斑點雜交

斑點雜交(Dot blotting)方法是直接將被檢標本點到膜上,烘烤固定。這種方法耗時短,可做半定量分析,一張膜上可同時檢測多個樣品。為使點樣準確方便,市售有多種多管吸印儀(manifolds),如MinifoldⅠ和Ⅱ、BioDot(BioRad)和HybriDot。它們有許多孔,樣品加到孔中,在負壓下就會流到膜上呈斑點狀或狹縫狀,取出膜烤幹或紫外線照射以固定標本,這時的膜就可以進行後續雜交和檢測過程。

2.7.5原位雜交

原位雜交(In Situ Hybridization),屬於固相分子雜交的範疇,它是用標記的DNA或RNA為探針,在原位檢測組織細胞內特定核酸序列的方法。根據所用探針和靶核酸的不同,原位雜交可分為DNADNA雜交,DNARNA雜交和RNARNA雜交三類。

根據探針的標記物是否直接被檢測,原位雜交又可分為直接法和間接法兩類。直接法主要用放射性同位素、熒光及某些酶標記的探針與靶核酸進行雜交,雜交後分別通過放射自顯影、熒光顯微鏡術或成色酶促反應直接顯示。

圖267小鼠大腦切片中腦啡肽基因的

組織細胞表達模式

間接法一般用半抗原標記探針,最後通過免疫組織化學法對半抗原定位,間接地顯示探針與靶核酸形成的雜交體。

原位雜交的特點在於對組織細胞的處理過程。需要進行組織固定、包埋,以實現保持細胞結構和最大限度地保持細胞內DNA或RNA水平的目的。為了使探針易於進入細胞或組織等,須對組織切片(8μm厚度)或對組織進行處理,增強組織的通透性。圖267所示為小鼠大腦切片中腦啡肽基因的組織細胞表達模式(黑色斑點部分)。

2.7.6熒光原位雜交

熒光原位雜交(Fluorescence in situ hybridization, FISH)是一項分子細胞遺傳學技術,是20世紀80年代末期在原有的放射性原位雜交技術的基礎上發展起來的一種非放射性原位雜交技術。目前這項技術已經廣泛應用於動植物基因組結構研究、染色體精細結構變異分析、人類產前診斷、腫瘤遺傳學和基因組進化研究等許多領域。FISH的基本原理是用已知的標記單鏈核酸為探針,按照堿基互補的原則,與待檢材料中未知的單鏈核酸進行特異結合,形成可被檢測的雜交雙鏈核酸。由於DNA分子在染色體上是沿著染色體縱軸呈線性排列,因而探針可以直接與染色體進行雜交,從而將特定的基因在染色體上定位(圖268)。與傳統的放射性標記原位雜交相比,熒光原位雜交具有快速、檢測信號強、雜交特異性高和可以多重染色等特點,因此在分子細胞遺傳學領域受到普遍關注。操作過程中需要製備染色體玻片標本。

圖268著絲粒重複序列探針在染色體上的熒光原位雜交信號(箭頭所示)

2.7.7蛋白質印跡

蛋白質印跡的基本原理和分子雜交實驗不同,是依賴抗原和抗體之間的特異相互識別來鑒定特定蛋白質的技術。雖然原理不同,但是操作方法和與Southern Blotting或Northern Blotting雜交方法類似,所以在分子雜交這一節進行介紹。蛋白免疫印跡(Western Blotting)是將電泳分離後的細胞或組織總蛋白質從凝膠轉移到固相支持物NC膜或PVDF膜上,然後用特異性抗體檢測某特定抗原的一種蛋白質檢測技術,現已廣泛應用於基因在蛋白水平的表達研究、抗體活性檢測和疾病早期診斷等多個方麵。

Western Blotting法采用聚丙烯酰胺凝膠電泳分(SDSPAGE)離蛋白質樣品,用特異的抗體代替分子雜交實驗中的探針識別目標靶蛋白並與之結合,再用標記的第二抗體識別第一抗體,從而對“雜交信號”進行顯色。Western雜交操作流程包括蛋白樣品的製備,SDSPAGE分離樣品(圖269A),分離的蛋白轉移到膜上,轉移後首先將膜上未反應的位點封閉起來以抑製抗體的非特異性吸附,用固定在膜上的蛋白質作為抗原,與對應的非標記(一抗)結合,洗去未結合的一抗,加入酶偶聯或放射性同位素標記的二抗,通過顯色或放射自顯影法檢測凝膠中的蛋白成分等過程(圖269B)。

圖269細菌總蛋白的SDSPAGE分離及GSTMPG蛋白融合蛋白的印跡結果

GST抗體作為一抗,帶標記的二抗取決於一抗來源物種(如一抗來源於小鼠,二抗為兔抗鼠或羊抗鼠),M為蛋白質分子標記,最大分子量為97kD

2.8核酸和蛋白質的高通量分析

隨著高通量測序技術的發展,獲得某種生物的全基因組序列信息相對來說比較簡單。隨著基因組時代到來的是後基因組時代,是以功能基因組學、轉錄組學、蛋白質組學、代謝組學等各種組學為代表的揭示基因組中相關基因功能和調控網絡的功能的研究時代。在此之前人們通常借助基因芯片和蛋白質芯片技術來進行基因的高通量研究。

2.8.1基因芯片和蛋白質芯片技術

21世紀前10年中相關的高通量研究技術有以分子雜交為基礎發展起來的基因芯片技術、蛋白質芯片技術和以雙向電泳為基礎發展起來的蛋白質組學技術。

基因芯片(又稱DNA芯片、生物芯片)技術係指將大量(通常每平方厘米點陣密度高於400)探針分子固定於支持物上並與標記的樣品分子進行雜交,通過檢測每個探針分子的雜交信號強度進而獲取樣品分子的數量和序列信息。通俗地說,就是通過微加工技術,將數以萬計乃至百萬計的特定序列的DNA片段(基因探針),有規律地排列固定於2cm2的矽片玻片等支持物上,構成的一個二維DNA探針陣列,與計算機的電子芯片十分相似,所以被稱為基因芯片。基因芯片技術由於同時將大量探針固定於支持物上,所以可以一次性對樣品大量序列進行檢測和分析,從而解決了傳統核酸印跡雜交(Southern Blotting和Northern Blotting等)技術操作繁雜、自動化程度低、操作序列數量少、檢測效率低等不足。而且,通過設計不同的探針陣列、使用特定的分析方法可使該技術具有多種不同的應用價值,如基因表達譜測定、突變檢測、多態性分析、基因組文庫作圖及雜交測序等。

基因芯片操作流程:

(1) 芯片製備

芯片主要以玻璃片或矽片為載體,采用原位合成和微矩陣的方法將寡核苷酸片段或cDNA作為探針按順序排列在載體上。芯片的製備除了用到微加工工藝外,還需要使用機器人技術,以便能快速、準確地將探針放置到芯片上的指定位置。對於一些模式生物,如小鼠和擬南芥等,有各種已製備好的商業化芯片供研究使用。

(2) 樣品製備

生物樣品往往是複雜的生物分子混合體,除少數特殊樣品外,一般不能直接與芯片反應,有時樣品的量很小。所以,必須將樣品進行提取、擴增,獲取其中的蛋白質或DNA、RNA,然後用熒光標記,以提高檢測的靈敏度和使用者的安全性。

(3) 雜交反應

雜交反應是熒光標記的樣品與芯片上的探針進行的反應,產生一係列信息的過程。選擇合適的反應條件能使生物分子間反應處於最佳狀況中,減少生物分子之間的錯配率。

(4) 信號檢測和結果分析

雜交反應後的芯片上各個反應點的熒光位置、熒光強弱經過芯片掃描儀和相關圖像分析軟件,將熒光轉換成數據,即可以獲得有關生物信息。基因芯片技術發展的最終目標是將從樣品製備、雜交反應到信號檢測的整個分析過程集成化以獲得微型全分析係統(micro total analytical system)或稱縮微芯片實驗室(laboratory on a chip)。使用縮微芯片實驗室,就可以在一個封閉的係統內以很短的時間完成從原始樣品到獲取所需分析結果的全套操作。

目前發展的芯片有表達譜芯片,用以分析不同樣品中的基因表達差異。全轉錄本長鏈不編碼RNA(Long Noncoding RNA,lncRNA)芯片,篩選差異表達的lncRNA和mRNA、lncRNA功能注釋、lncRNA調控機製預測。miRNA芯片,檢測miRNA表達水平、差異miRNA篩選、差異miRNA靶基因預測。甲基化芯片,是一種DNA甲基化高通量篩選技術,精確到單個堿基的甲基化變化。因為人類的許多疾病(包括癌症)是由於異常的甲基化引起,甲基化芯片可在人類幹細胞中鑒定出非CpG甲基化位點、miRNA啟動子區域以及腫瘤和正常組織中差異表達的甲基化位點。全基因組SNP檢測芯片,適用於全基因組SNP分型研究及基因拷貝數變化研究,一張芯片可檢測幾十到幾百萬標簽SNP位點。

蛋白質組學是一門以全麵的蛋白質性質研究為基礎,在蛋白質水平上對疾病機理、細胞模式、功能聯係等方麵進行探索的科學。可用於蛋白質表達譜分析,研究蛋白質與蛋白質的相互作用,甚至DNA蛋白質、RNA蛋白質的相互作用,篩選藥物作用的蛋白靶點等。蛋白芯片技術的研究對象是蛋白質,其原理是對固相載體進行特殊的化學處理,再將已知的蛋白分子產物固定其上(如酶、抗原、抗體、受體、配體、細胞因子等),根據這些生物分子的特性,捕獲能與之特異性結合的待測蛋白(存在於血清、血漿、淋巴、間質液、尿液、滲出液、細胞溶解液、分泌液等),經洗滌、純化,再進行確認和生化分析。它為獲得重要生命信息(如未知蛋白組分、序列,體內表達水平,生物學功能,與其他分子的相互調控關係,藥物篩選,藥物靶位的選擇等)提供有力的技術支持。蛋白芯片可用於差異蛋白鑒定、藥物篩選和疾病檢測等。

早期蛋白質組學的研究以雙向電泳技術為基礎。雙向電泳技術(包括熒光差異雙向電泳)是將不同來源的蛋白樣品依靠分子量大小和等電點進行分離和定量,結合基於基質輔助激光解析電離飛行時間質譜(MALDITOF\/TOFMS)的串聯質譜技術對差異表達蛋白進行鑒定,是蛋白質組學研究最經典和常用的技術之一。雖然現在由於該技術分辨率相對較低,限製了在高複雜度樣品中的應用,但由於其具有易觀察、成本較低等優點,仍然是蛋白質組研究的重要技術手段之一。

2.8.2新一代核酸和蛋白分子的高通量研究技術

近十年來,隨著技術的發展,又有一係列針對蛋白質和核酸分子的高通量研究技術麵市,在生命科學的各個領域發揮著越來越重要的作用。下麵介紹iTRAQ標記定量蛋白質組學技術、RNA Sequencing技術和全基因組關聯分析技術的原理和應用。

2.8.2.1iTRAQ標記定量蛋白質組學

iTRAQ (Isobaric tag for relative and absolute quantitation)是由AB SCIEX公司研發的一種體外同重同位素標記的相對與絕對定量技術。iTRAQ試劑由三部分組成:報告基團、平衡基團和肽反應基團(圖270)。報告基團有8種分子量,範圍從113~121(無120);平衡基團也有8種不同的分子量,與不同的報告基團搭配,使得八種iTRAQ試劑分子量相等。能保證被標記的不同來源的同一肽段在一級質譜中具有相同的質荷比;肽反應基團能與肽段氨基端(N端)及賴氨酸側鏈氨基發生共價連接使肽段連上標記,幾乎可以標記樣本中所有蛋白質(圖271)。

圖270iTRAQ試劑由報告基團、平衡基團和肽反應基團三部分組成

標記的多肽樣品等量混勻後,經液相色譜分離及串聯質譜(MS\/MS)分析,可得到各肽段的一、二級質譜信息。一級質譜中,任何一種iTRAQ試劑標記的不同樣品中的同一肽段表現出相同的質荷比;二級質譜中,化學鍵斷裂釋放出iTRAQ報告離子,在質譜低質量區產生了8個報告離子峰,其強度反映了該肽段在不同樣品中的相對表達量信息,另外二級質譜中的肽段碎片離子峰質荷比反映了該肽段的序列信息。這些質譜原始數據經過數據庫檢索,可得到蛋白質的定性和相對定量信息(圖271)。通過生物信息學分析即可鑒定出所測蛋白及其在各樣品中的表達差異。

iTRAQ技術操作有以下幾個流程:蛋白質的提取,胰酶消化,iTRAQ試劑分別標記不同樣本,液相色譜分離及串聯質譜(MS\/MS)檢測,蛋白質數據的定性和定量分析。

圖271iTRAQ技術操作流程示意圖

1. 應用範圍

(1) 尋找差異表達蛋白,並分析蛋白功能。

(2) 定性與定量分析蛋白:分析結果可得出各樣品中蛋白名稱及蛋白量的比值。

(3) 差異基因篩選:利用統計學方法篩選差異表達的蛋白和差異表達的基因。

(4) Pathway enrichment分析:找出差異表達基因在生物學通路中的位置,以闡明其生物學功能以及不同基因之間的相互作用。

2. 技術優勢

(1) 靈敏度高:低豐度蛋白也能檢測出。

(2) 適用範圍廣:幾乎可對任何物種的各類蛋白質進行分離鑒定。

(3) 高通量:能同時對10組樣本中包含的蛋白進行鑒定及表達差異分析。

(4) 高效:液相色譜與串聯質譜連用,自動化操作,分析速度快,分離效果好。

2.8.2.2RNA sequencing(RNA測序分析,轉錄組分析)

轉錄組是特定組織或細胞在某一發育階段或功能狀態下轉錄出來的所有RNA的總和,主要包括mRNA和非編碼RNA(noncoding RNA, ncRNA)。轉錄組研究是基因功能及結構研究的基礎和出發點,了解轉錄組是解讀基因組功能元件和揭示細胞及組織中分子組成所必需的,並且對理解機體發育和疾病具有重要作用。整個轉錄組分析的主要目標:對所有的轉錄產物進行分類;確定基因的轉錄結構,如其起始位點,5′和3′末端,剪接模式和其他轉錄後修飾;量化各轉錄本在發育過程中和不同條件下(如生理\/病理)表達水平的變化。

轉錄組分析技術經曆了幾代的發展,從基於雜交技術的芯片(Gene chip或microarray)技術、基於序列分析的基因表達係列分析(Serial analysis of gene expression, SAGE)和大規模平行信號測序係統(Massively parallel signature sequencing, MPSS),以及目前應用廣泛的RNASeq技術。RNASeq技術具有諸多獨特優勢,該技術能夠在核苷酸水平對任意物種的整體轉錄活動進行檢測,在分析轉錄本的結構和表達水平的同時,還能發現未知轉錄本和稀有轉錄本,精確地識別可變剪切位點以及cSNP(編碼序列單核苷酸多態性),提供更為全麵的轉錄組信息。相對於傳統的芯片雜交平台,RNASeq無須預先針對已知序列設計探針,即可對任意物種的整體轉錄活動進行檢測,提供更精確的數字化信號,更高的檢測通量以及更廣泛的檢測範圍。

我們之前介紹的高通量測序技術都能進行RNA測序,如以Roche公司的454技術、Illumina公司的Solexa技術和ABI公司的SOLiD技術以及HelicosBiosciences公司推出單分子測序(Single molecule sequencing, SMS)技術。

RNASeq的應用範圍:

(1) 轉錄本結構研究

利用單堿基分辨率的RNASeq技術可極大地豐富基因注釋的很多方麵,包括5′\/3′邊界鑒定、UTRs區域鑒定以及新的轉錄區域鑒定等。RNASeq還可對可變剪接(Alternative splicing)進行定量研究。

(2) 轉錄本結構變異研究

在發現序列差異(如融合基因鑒定、編碼序列多態性研究)方麵,RNASeq也展示了其很大的潛力。發現可能是由反式剪接所產生轉錄融合事件。

(3) 基因表達水平研究

原則上,RNASeq有可能確定細胞群中的每一個分子的絕對數量,並對實驗之間的結果進行直接比較。RNASeq一個特別強大的優勢是它可以捕捉不同組織或狀態下的轉錄組動態變化而無須對數據集進行複雜的標準化。

(4) 非編碼區域功能研究

轉錄組學研究的一個重要方麵就是發現和分析非編碼RNA(Noncoding RNA, ncRNA)。ncRNA按其功能可分為看家ncRNA和調節ncRNA。前者通常穩定表達,發揮著一係列對細胞存活至關重要的功能,主要包括轉移RNA(tRNA)、核糖體RNA(rRNA)、小核RNA(snRNA)及小核仁RNA(snoRNA)等;後者主要包括lncRNA和以microRNA為代表的小ncRNA(small ncRNA),在表觀遺傳、轉錄及轉錄後等多個層麵調控基因表達。過去對ncRNA的研究大部分集中於小ncRNA,如microRNAs和siRNAs。最近幾年的研究集中在lncRNA,證實lncRNA具有明確的生物學功能,與癌症、冠心病及神經退行性疾病等多種疾病密切相關。

2.8.2.3全基因組關聯分析

全基因組關聯分析(genomewide association study, GWAS)是近年來興起的遺傳分析方法,在人類和動植物複雜性狀遺傳研究中已取得初步成果。全基因組關聯分析是應用基因組中數以百萬計的單核苷酸多態性(single nucleotide ploymorphism,SNP)為分子遺傳標記,進行全基因組水平上的對照分析或表型相關性分析,通過比較發現造成複雜性狀的基因變異的一種新策略。

人類和動植物的複雜性狀都是多基因控製的數量性狀,存在基因間的相互作用(上位性)以及基因在不同環境的特異表達(環境互作)。所以,鑒定複雜遺傳性狀的遺傳基礎一般來說是比較困難的。最近十幾年,隨著基因組技術的快速發展,特別是測序技術手段的提高,人類全基因組計劃和許多動植物的全基因組測序已經完成,全基因組關聯分析已經成為研究複雜性狀的重要方法。

GWAS的研究原理是在基因水平上通過分子標記的手段,對整個基因組內的SNP進行綜合分析與分型,再將不同表現的性狀變異統計出來,提出假設,並且驗證其與期望性狀間的關聯性。

總之,人類的GWAS研究結果能夠幫助人們弄清人類複雜疾病和性狀的遺傳基礎,通過對檢測到的關聯位點和基因進行深入研究,從而為破解複雜性疾病和複雜性狀的遺傳奧秘提供思路。與人類和動物的GWAS研究相比,植物GWAS研究可以在多種環境條件下測量表型數據,從而通過減小環境引起的誤差和測量誤差來增加表型測量的精確性。而且,一個群體的基因型數據測量完成後,可以對這個群體的多個性狀進行分析。對動植物中的GWAS研究結果為闡明動植物複雜性狀的遺傳結構提供了理論基礎,可以將檢測到的關聯位點運用到分子輔助選擇育種中,對動植物的品種改良具有指導性意義。

在未來一段時間內,隨著基因組測序成本的顯著下降和各種統計方法的不斷完善,GWAS將更多地應用於多種複雜性狀的研究中。隨著現代遺傳學、基因組學和其他生物技術的不斷進步,GWAS研究將在以下兩個方麵有所突破:第一個方麵為多組學水平上的GWAS研究。表型變異不僅僅是由DNA序列多態性造成的,而且還受到基因表達水平的影響,基因表達差異產生各種蛋白和代謝物。近年來,基因組技術和轉錄組、蛋白組及代謝組測量水平有了較大的提高,為采用係統生物學手段研究複雜性狀的遺傳結構提供了可能。其中,基於代謝物的全基因組關聯分析(mGWAS)研究較多,已經在擬南芥、玉米和水稻研究中取得了進展。第二個方麵為多性狀的GWAS研究。在複雜性狀的GWAS研究中,一些遺傳變異位點可能控製多個性狀的遺傳結構,分別研究每個性狀的遺傳結構可能會降低GWAS的功效。為此,一些經典的多元性狀研究方法被應用於GWAS中,如基於似然函數的線性混合模型和廣義估計方程及這些方法的擴展。多性狀的GWAS研究結果表明,多性狀模型相對於單個性狀分析能夠提高關聯位點檢測到的功效。

特配電子資源

線上資源

微信掃碼

 網絡習題

 視頻學習

 延伸閱讀

第3章基因工程常用載體和工具酶

第3章基因工程常用載體和工具酶

基因工程中基因克隆的基本過程為把感興趣的目的基因(外源基因)連接到能夠在宿主細胞中進行複製擴增的DNA分子(載體)上形成重組DNA分子,再轉入到宿主細胞中,外源基因隨著載體的擴增而擴增。獲得重組分子,必須有合適的載體以及對載體及待克隆的DNA片段進行切割、修飾及連接的各種工具酶。本章將對各種載體和工具酶進行詳細介紹。

3.1載體

基因克隆過程中外源基因片段由於缺乏複製起始位點或與宿主染色體的同源序列,進入宿主細胞後往往因不能自主複製或重組整合到宿主基因組中而發生降解。所以,克隆過程中需要借助特殊的工具才能進入宿主細胞並在宿主細胞中擴增或表達。這種能夠攜帶外源目的基因或DNA片段進入宿主細胞進行複製和表達的工具稱為載體。載體的本質為雙鏈DNA分子,但是該DNA分子必須具備能在宿主細胞中進行複製並傳遞到子代細胞的能力等兩種特性。綜合來說,載體的功能可分為三個方麵。第一,為外源基因提供進入受體細胞的轉移能力;第二,為外源基因提供在受體細胞中的複製、擴增或整合能力(指DNA拷貝數的增加),這是所有載體必須具備的能力;第三,為外源基因提供在受體細胞中的表達能力(指基因的表達,使外源基因轉錄生成mRNA和翻譯形成蛋白質,並在受體細胞中發揮功能,進而可發現基因在生物體內發揮的作用)。

質粒DNA和噬菌體DNA這兩類天然的DNA分子具備上述特性。但是,常用的載體都需要在天然DNA分子的基礎上進行相關改造,改造後的DNA分子必須具備以下條件,才能滿足基因克隆和表達等需要。(1) 具有複製原點或整合位點,能使外源基因在受體細胞中穩定遺傳;(2) 具有多種單一的核酸內切酶的識別切割位點(多克隆位點,multicloning site, MCS);(3) 具有合適的選擇性標記,便於重組DNA分子的檢測;(4) 易於擴增和分離純化;(5) 表達載體還應具備表達調控元件。

3.1.1質粒來源載體

3.1.1.1質粒的基本特性

質粒是來自細菌細胞染色體外的獨立存在的DNA分子,能進行獨立複製和遺傳。質粒上攜帶一個或多個基因,基因產物將賦予細菌特定的表型。比如質粒上攜帶的抗生素抗性基因,如氨苄青黴素和氯黴素抗生素抗性基因可以使細菌能夠在含有一定濃度抗生素的培養基中生長。實驗室中,抗生素抗性基因常被作為一種選擇標記,可以保證培養基上生長的細菌含有某種特定的質粒。大部分質粒上還含有複製起始位點序列,可以保證質粒在宿主細胞中獨立於染色體DNA進行複製。一般小的質粒自身獨立複製所需複製酶來源於宿主細胞;而大的質粒上會攜帶特定的基因,合成複製酶用於自身DNA的複製。還有少量的質粒采用重組到宿主染色體DNA上的方式,隨宿主染色體DNA的複製而複製,這類質粒稱為附加體(episome),可以重組到宿主染色體DNA,穩定遺傳多代,但也可在特定階段以遊離分子存在。

對於基因克隆來說,載體的大小和拷貝數至關重要。載體的大小以小於10kb為宜。天然質粒的大小範圍跨度很大,最小的約長1kb,而最大的可達250kb。所以隻有少量的質粒符合克隆的目的。但是,一些大質粒在特定條件的克隆中也有其應用價值。

質粒的拷貝數是指在一個特定的宿主細胞中質粒的分子數量多少。根據質粒拷貝數的多少,將質粒分為嚴謹型質粒和鬆弛型質粒兩類。嚴謹型質粒一般指一些大分子量的質粒,為低拷貝,在細胞中往往隻有一到兩個質粒分子;鬆弛型質粒的拷貝數較高,至少在50個以上,可以多達上千個拷貝。基因克隆中一般使用由鬆弛型質粒改造來的載體分子,可以獲得大量的重組DNA分子。

另一個影響質粒成為載體分子的特性是質粒的接合型和兼容性。質粒按照能接合與否分為接合型質粒和非接合型質粒。接合型質粒又叫自我轉移性質粒,除含有自我複製基因外,還帶有一套控製細菌配對和質粒接合轉移的基因“tra”,如F質粒、部分R質粒和部分Col質粒。當細菌通過菌毛相互接觸時,質粒DNA就可從一個細胞(細菌)轉移至另一個細胞(細菌)。非接合型質粒上不具有質粒接合轉移基因,不能發生質粒DNA的自我轉移,但如果和其他接合型質粒共同存在於一個細胞,也可以發生共轉移。考慮到基因工程的安全性問題,需要選用非接合型質粒進行載體的改造。

細菌細胞中可能同時存在兩種或兩種以上不同的質粒類型,不同質粒可在一個細菌細胞中共存的現象稱為質粒的相容性。同種的或親緣關係相近的兩種質粒不能同時穩定地保持在一個細胞內的現象,稱為質粒不相容性。利用同一複製係統的不同質粒同時導入同一細胞時,它們在複製及隨後分配到子細胞的過程中彼此競爭,在一些細胞中,一種質粒占優勢,而在另一些細胞中另一種質粒卻占上風。當細胞生長幾代後,占少數的質粒將會丟失,因而在細胞後代中隻有兩種質粒的一種。所以,不同質粒間可劃分為不同的相容群或不相容群。共存於同一種細菌中的質粒必須屬於不同的不相容群。

質粒根據它們所帶有的基因以及賦予宿主細胞的特點可以分為五種不同的類型:

(1) 抗性質粒(Resistance plasmids, R):它們帶有抗性基因,可使宿主菌對某些抗生素產生抗性,如對氨苄青黴素、氯黴素等產生抗性。不同的細菌中也可含有相同的抗性質粒,如RP4質粒在假單胞菌屬和其他細菌中都存在。R質粒還可以通過感染的形式在不同種的細菌中傳播。

(2) 致育因子(Fertility plasmids, F):可以通過接合在供體和受體間傳遞遺傳物質。F因子約有1\/3的DNA構成一個控製DNA轉移的操縱子,約35個基因,負責合成和裝配性菌毛。這個操縱子受traJ基因產物的正調節。它還具有重組區和複製區。重組區含有多個插入序列,通過這些插入序列進行同源重組。在複製區有兩個複製起始點:一個是oriV,供給F因子在宿主中自主複製時使用;另一個是oriT,供接合時進行滾環複製的起始點。

(3) Col質粒:帶有編碼大腸杆菌素(colicins)的基因。大腸杆菌素可殺死其他細菌。如E.coli中的ColE1。

(4) 降解質粒(degradative plasmids):這種質粒編碼一種特殊蛋白,可使宿主菌代謝特殊的分子,如甲苯或水楊酸。

(5) 侵入性質粒(virulence plasmids):這些質粒使宿主菌具有致病的能力。如Ti質粒,這是在根癌農杆菌(Agrobacterium tumefaciens)中發現的,現經過加工用來作為植物轉基因的一種常用載體。

3.1.1.2質粒來源載體介紹

在對野生質粒的大小、拷貝數、序列信息、接合和兼容特性等信息了解的基礎上,就可以對質粒進行相關改造或進行不同質粒來源的片段重組,獲得我們所需的載體分子。對野生質粒的改造通常包括以下幾個方麵的內容:(1) 刪除不必要的DNA序列,縮小質粒相對分子量,提高外源DNA片段的裝載量;(2) 滅活一些質粒上的基因(如可轉移基因),保證重組實驗的安全,滅活質粒拷貝數的負控製基因,提高質粒的拷貝數;(3) 加入選擇性標記,便於重組子的檢測;(4) 加入多克隆位點,便於外源基因的插入;(5) 根據克隆的目的,加裝特殊的表達元件或便於蛋白純化的元件(如GST標簽)。以下為曆史上一些較為重要的載體和廣泛使用載體的介紹。

1. 質粒載體實例1:pBR322

pBR322是第一個人工構建的重要質粒,是應用最早且最廣泛的大腸杆菌質粒載體之一。質粒載體pBR322中的“p”代表質粒(即Plasmid的首字母);“BR”代表構建這一載體的實驗室名稱,即兩位研究者Bolivar和Rogigerus姓氏的首字母;“322”是實驗編號。雖然與最新構建的質粒載體相比,pBR322缺失複雜的載體原件且在研究中應用越來越少,但是以它為例也能很好闡明質粒的基本特性。質粒載體pBR322的大小為4361bp,相對分子質量較小是它的第一個優點,最高可提供大於6kb的DNA片段的插入,組成的重組DNA分子大小還在可操作的範疇之內(10kb)。優點之二是它帶有一個複製起始位點ori,保證了該質粒隻在大腸杆菌的細胞中行使複製的功能。具有兩種抗生素抗性基因——氨苄青黴素抗性基因和四環素抗性基因,可為轉化子和重組子提供選擇標記是它的第三個優點。兩個抗性基因上各有幾種限製性內切酶的單一切點,氨苄青黴素抗性基因上有PstⅠ、PvuⅠ和ScaⅠ三種酶的切點;四環素抗性基因上有BamHⅠ和HindⅢ兩種酶的切點。幾種酶切位點提供了多種通過黏性末端插入外源基因片段的選擇,外源基因的插入造成基因插入失活,使宿主菌喪失氨苄青黴素或四環素的抗性表型,可用來進行重組DNA分子的篩選。質粒載體pBR322的第四個優點是具有較高的拷貝數,雖然每個細胞中pBR322的拷貝數為15個左右,經過蛋白合成抑製劑氯黴素處理以後,每個細胞中可擴增累積到1000~3000份拷貝,該特性為重組體DNA的製備提供了極大的方便。氯黴素擴增質粒,並不是因為質粒上有氯黴素抗性基因而外界給予選擇壓力,而是因為氯黴素能夠抑製蛋白合成並阻止細菌染色體複製,從而使得細菌不再繁殖,但此時質粒仍然可以複製。所以氯黴素擴增質粒,隻是通過增加每個細菌中的拷貝數從而提高質粒產量,並非同時增加細菌量和拷貝數。

現在構建的重組質粒拷貝數一般都能滿足提取的要求,不需要擴增。早期使用氯黴素,嚴格來說並不是不能獲取足夠的質粒DNA的產量,而是要提高“單位產量”,因為大量高度黏稠的濃縮細菌裂解物,為後續質粒提取增加困難,而在對數中期加入氯黴素可以避免這種現象。有氯黴素存在時從較少量細胞獲得的質粒DNA的量與不加氯黴素時從較大量細胞所得到的質粒DNA的量大致相等。

pBR322是由R1(pSF2124)、R65(pSC101)及pMB1三個親本質粒經複雜的重組過程構建而成的。氨苄青黴素抗性基因、四環素抗性基因和複製起始位點ori分別來自R1(pSF2124)、R65(pSC101)和pMB1親本質粒(圖31)。

圖31pBR322載體構成及來源

2. 質粒載體實例2:pBR322係列質粒pBR327

pBR327質粒載體是從pBR322載體改造而來的,刪除了長約1089bp的序列,序列刪除沒有破壞兩個抗性基因的任何序列,但是改變了質粒的複製和接合相關的特性。這一改造為後來構造更為精巧的質粒載體奠定了基礎,因為它從兩個方麵增強了質粒作為載體的優越性:第一,在複製功能的改變意味著pBR327比pBR322具有較高的拷貝數,大約在每個大腸杆菌細胞有30~45質粒分子;第二,1089bp序列的刪除也破壞了pBR322的接合能力,使pBR327成為一非接合型質粒,不能自主轉移到其他大腸杆菌細胞,這對於生物安全和限製基因漂流非常重要。

雖然pBR327像pBR322一樣不再被廣泛使用,但是其序列組分存在於大多數現代質粒載體中。現代常用質粒有很多種,沒有必要一一介紹,另外兩個例子將足以說明載體的其他兩個最重要的特性。

3. 質粒載體實例3:pUC8係列質粒

pUC8是從pBR322載體改造來的,隻留取了氨苄青黴素抗性基因和複製子的序列,載體分子量更小,隻有2750bp。而且氨苄青黴素抗性基因的序列也經過了修飾(同義密碼子替換),刪除了一些限製性內切酶的切點(即出現在多克隆位點區域之外的酶的識別和切割位點)。載體上添加了選擇標記基因lacZ′和乳糖操縱子的啟動子調控序列。lacZ′是大腸杆菌β半乳糖苷酶基因lacZ的5′端序列,編碼β半乳糖苷酶的氨基端序列α肽,可通過與失去了正常氨基末端的β半乳糖苷酶突變體互補,即α互補形成有功能活性的β半乳糖苷酶,從而進行重組DNA克隆的藍白斑篩選。另外,載體上還添加了多克隆位點(Polylinker或Mutiple Cloning Site, MCS)(圖32)。多克隆位點是一段由人工合成的含有多種限製性核酸內切酶單一識別和切割位點的DNA序列。

pUC8中有三個突出的優點,使它成為應用最廣泛的大腸杆菌克隆載體之一。第一優點是偶然獲得的。在構建pUC8載體過程中伴隨著一次發生在複製起始位點的偶發突變,突變的結果使該質粒的拷貝數在不需要氯黴素處理擴增時就能達到500~700個拷貝。這可以顯著增加從宿主細胞中獲得的重組DNA分子的產量。

第二個優點為方便重組DNA的篩選。可以把轉化子細菌塗布在含有氨苄青黴素、異丙基硫代半乳糖苷(IPTG)和5溴4氯3吲哚βD吡喃半乳糖苷(Xgal)的培養基上進行一步篩選,即藍白斑篩選。pBR322和pBR327重組質粒的篩選則需要通過兩種抗生素平板的兩次篩選。所以,pUC8載體的新組成原件大大提高了重組DNA的篩選效率。

第三個優點為多克隆位點的添加。pUC8載體上的多克隆位點集中排列在lacZ′的5′端。插入的多克隆位點經過精巧設計,並不破壞lacZ′的讀碼框,仍能編碼產生α肽並能和宿主大腸杆菌染色體編碼的β半乳糖苷酶羧基端片段重組成具有完全活性的β半乳糖苷酶。多克隆位點含有9種限製性內切酶的單一切點,即在載體的其他序列上均不存在這9種限製性內切酶的識別和切割位點,方便克隆時酶切位點的選擇和定向克隆的操作(圖32)。

pUC質粒載體是一係列載體。pUC8載體的對應載體為pUC9,除了多克隆位點為反向插入之外,載體其他序列和組分與pUC8完全相同。pUC係列的其他成員如pUC18\/19含有更多限製性內切酶位點的組合,可以為DNA片段的克隆提供更大的靈活性(圖32)。

圖32pUC8及其係列載體構成及含有多克隆位點的lacZ′基因片段

4. 質粒載體實例4:pGEM3Z(用於所克隆DNA的體外轉錄)

pGEM3Z載體和pUC8大小完全一致,也含有氨苄青黴素抗性基因和多克隆位點的LacZ′篩選標記基因。兩者的區別在於pGEM3Z載體上多克隆位點的兩側分別添加了一段序列,這兩段序列是可被RNA聚合酶識別並結合的啟動子序列(圖33)。兩個啟動子序列分別處於多克隆位點的兩端,意味著如果在多克隆位點處插入某一DNA片段,並將這一重組DNA分子和RNA聚合酶在試管內混合,則這一片段將會從兩個方向分別被轉錄,生成這一基因的mRNA分子和反義RNA分子。生成的RNA分子可以作為分子雜交中的探針分子,也可用來進行RNA加工和蛋白質合成方麵的研究。

pGEM3Z載體上的啟動子序列不能被大腸杆菌的宿主RNA聚合酶所識別,常用的啟動子為分別被T7 RNA聚合酶和SP6 RNA聚合酶識別的T7啟動子和SP6啟動子(圖33)。T7 RNA聚合酶和SP6 RNA聚合酶分別來自大腸杆菌噬菌體T7和SP6,在噬菌體侵染大腸杆菌宿主細胞時產生,用於噬菌體自身基因的RNA分子合成。選擇這兩種RNA聚合酶進行體外轉錄是因為T7 RNA聚合酶和SP6 RNA聚合酶的活力超強,可以進行快速轉錄。可以在一分鍾內合成1~2mgRNA分子,合成效率比大腸杆菌體內的RNA聚合酶高出許多倍。

圖33pGEM3Z載體構成及體外轉錄特點

5. 質粒載體實例5:T載體(用於PCR產物的直接克隆)

圖34T載體pGEMT構成

在PCR過程中,普通的Taq DNA聚合酶具有能夠在所擴增的DNA片段3′末端加A的特性,如果線性化的載體分子3′端具有單堿基T的黏性末端,能夠快速對PCR產物進行克隆,這種克隆方法稱為TA克隆,所用的載體稱為T載體。pGEMT載體為常用的一種T載體(圖34)。

3.1.2噬菌體DNA來源載體

3.1.2.1噬菌體DNA的基本特性

噬菌體是專門感染細菌的病毒,和大多病毒一樣,噬菌體在結構上非常簡單,隻包含攜帶一些指導自身複製的相關基因的基因組DNA或RNA,

圖35二十麵體(A)和絲狀噬菌體(B)模式圖

以及由蛋白質分子組成的保護型衣殼。噬菌體的結構主要有兩種類型,即有尾部結構的二十麵體和絲狀噬菌體。有尾部結構的二十麵體噬菌體除了一個二十麵體的頭部外,還有由一個中空的針狀結構及外鞘組成的尾部,以及尾絲和尾針組成的基部,如λ噬菌體。絲狀噬菌體呈線狀,沒有明顯的頭部結構,而是由殼粒組成的盤旋狀結構,如M13噬菌體(圖35)。雖然噬菌體的種類有很多,但是隻有λ噬菌體和M13噬菌體在基因克隆過程中有廣泛的應用,所以將對兩種噬菌體的生活史、基因組結構等特性進行詳細介紹。

1. λ噬菌體

λ噬菌體的生活史可以分為溶菌(侵染)周期和溶源周期兩個部分。溶菌周期一般分為以下幾個階段。(1) 吸附。噬菌體以它的尾部末端高度特異性地吸附到敏感細胞表麵上某一特定的位點,如細胞壁、鞭毛或纖毛。(2) 侵入。將自身的遺傳物質(DNA)注入宿主細胞內。(3) 複製與合成。指噬菌體DNA和蛋白質外殼的複製。噬菌體DNA進入宿主細胞後,立即引起宿主的代謝改變,宿主細胞內的核酸不能按自身的遺傳特性複製和合成蛋白質,而由噬菌體核酸所攜帶的遺傳信息控製,借用宿主細胞的合成機構及酶等複製核酸,進而合成噬菌體的蛋白質。核酸和蛋白質裝配合成新的噬菌體。(4) 釋放。噬菌體顆粒成熟後,噬菌體的水解酶水解宿主細胞而使宿主細胞裂解,噬菌體被釋放出來。在一些噬菌體中,裂解周期進行得非常快,可以在20分鍾內完成。和裂解周期相比,在溶源周期中,噬菌體感染進入宿主細胞後,可以整合在噬菌體基因組DNA的特定位點,隨著宿主細胞的複製進行複製。此時的噬菌體DNA稱為原噬菌體,宿主菌稱為溶源菌。原噬菌體可以在宿主細胞中穩定存在,直到某些特定條件刺激下再重新進入溶菌周期。

λ噬菌體的基因組為雙鏈DNA分子,長度為48.5kb,共編碼61個基因,功能相關的一組基因成簇排列(圖36)。例如合成頭部和尾部蛋白的基因集中分布在左臂位置,占據了三分之一的基因組;和原噬菌體整合和切離有關的基因在基因組的中部;控製λ噬菌體基因轉錄相關的基因成簇排列在基因組的右臂處。在頭尾蛋白基因簇和切離與重組基因簇之間有一段序列為基因組非必須序列(圖36)。基因的成簇排列便於進行基因的成組調控,這是原核生物基因組采用操縱子進行基因調控的通用方式。

圖36λ噬菌體的基因組構成及cos位點在基因組線性化和環化過程的重要性

λ噬菌體的基因組可以以雙鏈環狀DNA和雙鏈線裝DNA兩種形式存在,雙鏈線狀DNA的兩端各有12個堿基的5′突出黏性末端是相互互補的,該互補序列相互作用形成cos位點。通過cos位點間的相互識別和接合可以使DNA分子在線性和環狀分子形式間進行轉換(圖36)。cos位點在λ噬菌體生活史中有兩方麵的用途:首先在溶源化過程中,線性的DNA分子進入宿主細胞後,需要首先進行環化才能重組進入宿主細胞基因組DNA。另外,在噬菌體複製過程中,λDNA采用滾環複製的形式以cos位點為間隔形成多聚體,一種由基因A編碼的內切酶可以識別共連體中的cos位點並在此位點進行交錯切割,生成獨立的含有cos位點黏性末端的λ基因組DNA,進而被包裝形成成熟的噬菌體顆粒。噬菌體的共連體DNA的切割和包裝隻需要識別cos位點及其附近序列,所以λ基因組DNA內部的序列結構的改變,如一個外源基因的插入,在沒有大幅改變基因組DNA大小的基礎上(保持改變後序列為原有序列長度的75%~105%),不會影響噬菌體的包裝和擴增。

2. M13噬菌體

M13噬菌體是典型的絲狀噬菌體,在生活史和結構上與λ噬菌體截然不同。M13噬菌體隻感染F+(含F質粒,能產生性菌毛)的大腸杆菌。感染宿主後通常不裂解宿主細胞,而是從感染的細胞中分泌出噬菌體顆粒,宿主細胞仍能繼續生長和分裂。但生長水平比未感染組低(圖37)。而且M13 DNA也不會插入到宿主細胞中成為原噬菌體。

圖37M13噬菌體生活史中不裂解宿主細胞,不進行溶源化

在宿主細胞內,以感染性的單鏈噬菌體DNA(正鏈)為模板,在宿主DNA聚合酶的催化下轉變成環狀雙鏈DNA,可作為下一輪DNA複製的模板,因此這種雙鏈DNA稱為複製型DNA(replicative form DNA),即RF DNA。通過θ複製方式,RF DNA進行擴增,在每個宿主細胞中的拷貝數可達到100個以上。隨著宿主細胞的分裂,RF DNA分配到子代細胞中並繼續進行複製,以維持細胞中的RF DNA拷貝數。RF DNA可以進行滾環複製生成正鏈單鏈DNA分子,並進行包裝生成新一代M13噬菌體顆粒,從宿主細胞中分泌出來,進行下一輪的感染(圖38)。在宿主細胞的一個世代中,分泌生成新的噬菌體顆粒可到達1000多個。M13噬菌體沒有包裝限製。

圖38M13噬菌體DNA的複製方式

M13噬菌體的基因組為單鏈DNA,基因組較小,隻有6407bp。相比λ噬菌體來說,編碼的基因數目較少,隻有11個編碼基因。因為M13噬菌體的衣殼蛋白隻需要三個基因的蛋白產物,而且M13噬菌體也不需要基因組插入和解離的基因(圖39)。

圖39M13噬菌體DNA的基因組成

M13噬菌體的幾個特征滿足其作為載體的條件。首先M13噬菌體基因組的大小隻有6407bp,M13噬菌體在用作載體時是利用其雙鏈RF DNA。RF DNA很容易從感染細胞中純化出來,可以像質粒一樣進行操作,並可通過轉化方法再次導入細胞。在M13噬菌體基因組中絕大多數為必需基因,基因Ⅱ和基因Ⅳ之間的508bp間隔區是主要的外源片段插入位點。M13噬菌體來源的載體的最後一個優勢為可以獲得克隆基因的單鏈DNA序列。

3. 其他生物病毒作為載體的例子

大多數生物都受到病毒的感染,而且除了細菌和酵母以外,質粒一般不存在於其他生物體內時,所以人們對高等生物病毒被用作克隆載體的可能性研究非常感興趣。幾種真核病毒已被用作專門用途的克隆載體。例如,人腺病毒用於基因治療,杆狀病毒被用來在昆蟲細胞中合成重要的藥用蛋白,花椰菜花葉病毒和雙聯病毒已被用於植物基因的克隆。這些在後文中會進行更全麵的討論。

3.1.2.2噬菌體來源係列載體

噬菌體來源的載體和質粒載體相比,一般來說具有更大的容量,在基因克隆過程中也有廣泛應用。

λ噬菌體作為載體第一個需要解決的問題就有其克隆容量的大小問題。由於λ噬菌體存在包裝限製,隻能在原有基因組大小的基礎上增加5%的水平,即最大包裝限度是 52kb。 在對λ噬菌體基因組DNA不做任何改變的情況下,λ噬菌體作為載體的最大克隆容量隻有3kb,遠遠不能滿足克隆的要求。值得慶幸的是,在λ噬菌體基因組的中部含有一段非必需區,非必需區不含與基因組DNA複製及編碼噬菌體結構蛋白等的重要基因(圖36)。但非必需區含有編碼催化在溶源周期中λDNA整合和解離相關的酶類,作為載體分子,要求其能夠大量擴增並能獨立存在,所以這一部分基因對於λDNA作為載體也是非必需的。這一段非必需區的序列長度約為15kb,將待克隆的基因序列替換λDNA的非必需區段,可以使λDNA來源載體的克隆容量增加到18kb。

λ噬菌體作為載體應用必須解決的第二個問題是酶切位點問題,即外源基因片段通過什麼酶切位點進入到載體分子內。由於λ噬菌體基因組DNA較大,常用的酶切位點在基因組中均勻分布且不止一個位點,這就為基因的克隆設置了障礙。一個解決方法為定點突變,例如把EcoRⅠ的識別序列由GAATTC轉變為GGATTC,就不再會被EcoRⅠ所識別。但λ噬菌體載體剛發展時,定點突變的技術也處於起步階段,沒能在λ噬菌體DNA的改造中起作用。當時的方法是使用自然突變篩選法,即讓λ噬菌體去感染能夠產生特定限製性內切酶的大腸杆菌菌株,正常的λ噬菌體DNA均會被酶降解,不能持續侵染和擴增。但是如果λ噬菌體DNA上的EcoRⅠ位點發生改變,則不會被降解而能擴增並釋放出新一代的噬菌體顆粒,這新一代噬菌體即為不含EcoRⅠ位點的突變噬菌體。

解決了λ噬菌體載體的克隆容量、包裝限度和載體插入的酶切位點問題,λ噬菌體作為載體的改造和修飾工作進展順利,發展了兩類噬菌體載體,即插入型和替換型載體。

1. 插入型載體

插入型載體是指將λ噬菌體DNA的非必需區刪除,將λ噬菌體DNA的左臂和右臂連接起來形成的一類λ噬菌體載體。克隆容量根據刪除的非必需區段長度而有差異。插入型載體左右臂連接後攜帶一個或多個供外源DNA片段插入的限製性內切酶位點,這些位點集中排布在一起,位於篩選標記基因的內部。λ噬菌體載體的篩選標記基因有兩類,即cI基因和lacZ′基因。cI基因的產物為λ阻遏蛋白,這一阻遏蛋白可以使λ噬菌體感染宿主菌後進入溶源生活周期,不裂解細胞。cI基因插入失活後,λ噬菌體感染高頻溶源化(high frequency of lysogen,指因一些基因發生突變,被烈性噬菌體感染後細菌易溶源化的菌株)大腸杆菌突變菌株Hfl―後可進行溶菌生活周期,裂解宿主細胞形成空斑(透明的噬菌斑而非混濁的噬菌斑)。lacZ′基因的插入失活可使噬菌斑從藍色變為白色,從而方便重組體的篩選。

常見的插入型載體有兩種:(1) λgt10,克隆容量為8kb,插入位點為cI基因上的一個EcoRⅠ位點(圖310)。(2) λZAPⅡ,克隆容量為10kb,插入位點為lacZ′基因上的一個含有SacⅠ、NotⅠ、XbaⅠ、SpeⅠ、EcoRⅠ和XhoⅠ等6個酶切位點的多克隆位點(Polylinker)(圖310)。

圖310λ插入載體

P為Polylinker,含有SacⅠ、NotⅠ、XbaⅠ、SpeⅠ、EcoRⅠ和XhoⅠ等6個酶切位點的單一切點

2. 替換型載體(取代型載體)

替換型載體具有成對的克隆位點,在這兩個位點之間的λDNA區段可以被外源插入的DNA所取代(圖311a)。通常被取代的這一λDNA區段中還含有額外的酶切位點,在載體用內切酶酶切製備時,這一片段將會被切成多段而不會影響外源DNA片段的連接。替換型載體具有更大的克隆容量。重組DNA分子的篩選更多依賴於DNA分子的大小,未重組的DNA分子因為太小(小於λ基因組DNA的75%,即37kb)而不能被有效包裝。

λDASHⅡ是一種替換型載體,可以通過兩組多克隆位點間的片段替換克隆9kb~23kb 之間的DNA片段(圖311b)。兩組多克隆位點可提供酶切位點多種選擇。重組DNA分子的篩選可以通過DNA分子的大小和Spi表型鑒定等兩種方法(詳見第5章)。和質粒載體pGEM3Z一樣,插入的DNA的兩側同樣具備T3和T7噬菌體啟動子序列,可以獲得RNA轉錄本。

圖311λ替換載體

利用λ插入型和替換型載體進行克隆實驗時,可以采用兩種策略:一是載體分子通過cos位點進行連接成為雙鏈環狀分子,和質粒載體一樣進行酶切、連接和轉染宿主細胞,但是這種方式下轉染效率較低,獲得的重組DNA分子的量也比較少(圖312a);另一種策略為利用線性載體分子,將經過酶切的載體左臂、右臂和待克隆外源DNA片段混合並連接,會形成一個以左臂—DNA—右臂為基本單元的共連體,之後通過噬菌體的體外包裝(詳見第5章)獲得含有重組DNA分子的噬菌粒。這一噬菌粒再通過下一輪的侵染就可獲得大量的重組體,這一策略就大大提高了獲得重組子的效率(圖312b)。

圖312利用λDNA載體進行克隆的兩種不同策略

(a) 裸露環形λDNA轉染大腸杆菌(b) 線性λDNA經包裝成噬菌體顆粒侵染大腸杆菌

3. 黏粒載體(cohensiveend site plasmid, cos質粒)

cos質粒是一種雜合質粒,是人工構建的含有λDNA的cos(cohensiveend site)位點序列和質粒複製子的特殊類型的質粒載體。cos質粒開發的理論基礎在於λDNA多聚體進行體外包裝時,相關的酶隻需要cos位點的存在就可以進行工作。所以噬菌體的體外包裝不僅可以包裝λDNA,也可以包裝含有由cos位點間隔開的長37kb~52kb的DNA片段的串聯體。實際上,cos質粒就是含有cos位點的質粒載體,和質粒載體一樣,含有篩選標記、多克隆位點和複製起始位點,由於cos質粒缺失所有的λ基因,不能形成噬菌斑,但可以和質粒一樣使宿主細胞在篩選培養基上生長,如cos質粒pJB8(圖313)。

圖313cos質粒pJB8

利用cos質粒進行外源DNA片段的克隆如圖314所示,cos載體用某種特定的限製性內切酶酶切成線性分子;外源DNA片段一般要進行部分酶切才能獲得較大的DNA片段,滿足cos質粒的包裝要求;將載體和外源DNA片段進行連接會形成一個含有cos位點的共連體。利用體外包裝體係,可以將介於37kb~52kb的重組DNA分子進行有效包裝,包裝後的噬菌粒可以高效感染進入宿主菌,雖然不能形成噬菌斑,但是可以作為質粒分子在宿主細胞中擴增,形成大量的重組體。cos質粒的克隆容量可以達到45kb,可以用於基因組文庫的構建。

圖314利用cos質粒pJB8進行長基因片段的克隆

4. M13噬菌體來源載體(生成單鏈DNA的載體)

多年來,能夠提供克隆DNA單鏈版本的克隆載體一度非常重要。因為20世紀80年代和90年代DNA測序方法在使用過程中,均以單鏈DNA為起始原料。雖然這些測序方法現在已經被雙鏈DNA測序技術取代了。但是1980年代和1990年代設計的合成單鏈DNA的特殊載體仍然很重要,因為這種類型的DNA載體在體外誘變(第7章)和噬菌體展示(第7章)等方麵還有特殊用途。

第一個單鏈DNA的載體是基於M13噬菌體。正常M13噬菌體基因組是6.4kb的長度,大部分DNA由十個緊密排列的基因所占據(圖39),每一個都是複製噬菌體所必需的。其中隻有一個507核苷酸的基因間序列可以插入新的DNA而不破壞這些基因,而這個區域包含了DNA複製所必需的複製起始位點,必須保持完整。這意味著隻能在有限的範圍內修改M13基因組。在一個M13克隆載體的構建過程中,第一步是引入LacZ′基因到M13基因組序列。這形成了載體M13mp1,在含有Xgal瓊脂平板形成藍色噬菌斑(圖315a)。另外,在LacZ′基因內插入不同的多聚接頭(polylinker),創造出一係列含有不同克隆位點的M13載體(圖315b)。這些多聚接頭和質粒pUC上的MCS位點是一致的,M13mp8\/9和pUC8\/9的酶切位點一致;M13mp10\/11和pUC18\/19的酶切位點一致。意味著克隆的DNA可以在M13和pUC載體之間穿梭,可以分別獲得單鏈和雙鏈的DNA產物。

圖315M13載體的構建和實例

5. 噬菌粒載體

雖然M13載體對於克隆基因的單鏈DNA的產生是非常有價值的,但它們有一個重要缺陷。M13克隆載體的克隆容量很低。通常,1500bp被認為是其能達到的最大容量,盡管偶爾會有大於3kb的片段的克隆。為了解決這個問題,通過結合質粒DNA和M13基因組的一部分序列發展了多種混合載體(噬菌粒載體)。一個例子是pEMBL8(圖316),把M13基因組的一個1300bp的片段轉移到pUC8載體。這段M13 DNA序列含有可被DNA聚合酶識別的信號序列,在新噬菌體顆粒的分泌前,將以M13正常的雙鏈分子為模板生成單鏈DNA。這個信號序列即使與其餘的M13基因組分離,仍然具有功能,所以pEMBL8載體分子也被轉換成單鏈DNA,並分泌缺陷噬菌體顆粒(圖317)。值得注意的是,基因克隆中,pEMBL8載體感染大腸杆菌細胞宿主細胞,需要正常的M13噬菌體作為輔助噬菌體,

圖316噬菌粒載體pEMBL8

以提供必要的複製相關酶類和噬菌體外殼蛋白。因pEMBL8源自pUC8,具有位於LacZ′基因內的多克隆位點,所以重組噬菌體可以用標準的藍白斑的方式進行鑒定。利用pEMBL8載體,可獲得長達10kb的單鏈外源DNA片段,大大增加了M13載體係統的克隆容量。

圖317pEMBL8載體產生單鏈DNA分子

另外,由pUC18\/19質粒載體發展來的噬菌粒載體pUC118\/119和pBluescriptⅡ SK(+\/-)也有廣泛的應用(圖318、圖319)。pUC118\/119載體和pEMBL8載體相比,多克隆位點有更多的限製性內切酶的選擇(圖318);pBluescriptⅡ SK(+\/-)和上兩類載體相比,在多克隆位點兩側存在一對T3和T7噬菌體的啟動子,用以定向的指導外源DNA或基因的轉錄(圖319)。

圖318噬菌粒載體pUC118\/119

圖319噬菌粒載體pBluescriptⅡ SK(+\/-)

3.1.3原核細胞蛋白表達載體

之前介紹的質粒和噬菌體修飾相關載體隻能攜帶外源基因在宿主細胞中進行擴增或轉錄生成RNA分子,要實現外源基因在宿主細胞中的表達,產生蛋白質分子,需要載體上有另外的與蛋白表達相關的信號序列元件,能夠被宿主細胞轉錄和翻譯相關的酶或細胞器所識別。這些信號序列元件為一小段DNA序列,包括三種最重要的信號序列:啟動基因轉錄的啟動子序列(promoter),終止轉錄的終止子序列(terminator)以及翻譯過程核糖體識別和結合序列(ribosome binding site)。在表達載體上,還有編碼有利於表達後蛋白分離純化的序列標簽係列。常用的係列標簽有六聚組氨酸(6×HIS),穀胱甘肽標簽(GST)和八肽FLAG標簽(DYKDDDDK)等。這些標簽和擬表達蛋白形成融合蛋白。下麵以pET30a為例介紹蛋白表達載體的結構。

圖320展示了pET30ac的質粒全圖和載體上與克隆和表達相關的序列圖。質粒上攜帶來自pBR322的複製起始位點ori以及絲狀噬菌體f1的複製起始位點,質粒能進行自我複製並在輔助病毒作用下產生單鏈DNA。質粒的抗性篩選標記基因為卡那黴素抗性基因(KanR),含有Nco Ⅰ Xho Ⅰ的多克隆位點,便於外源基因的插入。此外表達載體上有基因轉錄和翻譯相關原件T7啟動子、T7終止子以及核糖體結合位點rbs,可使外源基因進行轉錄和翻譯,產生蛋白質。考慮到蛋白質的後續純化問題,載體上攜帶Histag,以及Stag編碼序列。Histag蛋白能通過親和層析進行蛋白純化,Stag為來自胰RNase A的一段15個氨基酸的小肽,Stag富含帶電荷和極性氨基酸,能使與之融合的蛋白質的溶解度提高,便於純化的進行。蛋白純化後需要將標簽去除,載體上還攜帶編碼兩個蛋白酶可識別的氨基酸位點,即凝血酶(thrombin)和腸激酶(enterokinase)識別位點。

圖320pET30ac表達載體

pET30a,b,c載體間的差異在於pET30b載體在NcoⅠ位點處的後麵序列缺失了一個堿基,pET30c載體在相同位點缺失了2個堿基,使此位點後的載體讀碼框序列發生了改變,造成後麵的氨基酸序列不同。pET30b載體在多克隆位點的上下遊都帶有His標簽,可使融合蛋白的純化效率更高。

3.1.4真核表達載體

圖321酵母2μm質粒的B形式

大多數基因的克隆實驗都是以大腸杆菌為宿主進行的,所以可用於大腸杆菌的克隆載體種類最多。然而,在某些情況下需要利用真核生物宿主細胞進行基因克隆和表達實驗,如通過基因克隆在真核表達係統中表達重組蛋白質、改變細胞或某種有機體的表型特征等過程(第5、6章)。真核表達載體在生物技術的各個方麵應用廣泛,所以我們有必要對真核生物表達載體進行闡述。根據真核生物的載體宿主不同,分為酵母細胞表達載體、植物細胞表達載體和動物細胞表達載體等三個類別。

3.1.4.1酵母細胞表達載體

釀酒酵母是生物技術領域中最重要的生物之一。除了其在釀造和加工方麵的作用,酵母還可作為宿主進行所克隆基因的蛋白產物的發酵,生產重要藥物(第8章)。酵母克隆載體的開發始於大多數釀酒酵母(S. cerevisiae)菌株中質粒的發現(圖321)。這個質粒是一個閉合環狀超螺旋DNA分子,長約2μm。被稱為2μm質粒,是真核細胞中所發現的少量質粒之一(圖321)。

幾乎所有的釀酒酵母中都含有2μm質粒(雙鏈環狀,分子長約6kb,拷貝數達70~200個)。REP1和REP2參與質粒的複製,控製質粒拷貝數的穩定性;FLP編碼產物驅動兩個IRs的同源重組,進行質粒分子內DNA重排,使質粒從A形式轉變為B形式。ori為複製原點。D基因產物參與控製質粒的穩定性。由於其分子大小隻有6kb,拷貝數也較多,所以2μm質粒非常適合做克隆載體。但是和大腸杆菌質粒一樣,2μm質粒不能直接用來做載體,也需要經過相關的遺傳改造。

1. 酵母細胞表達載體的選擇性標記

對2μm質粒進行相關改造,第一個需要解決的問題是在載體上添加適合的選擇性標記基因。一些酵母克隆載體攜帶對氨甲蝶呤和銅等抑製劑具有抗性的基因,但大多數常用的酵母載體利用了完全不同的選擇標記係統。實際上,一些正常的酵母基因,例如涉及編碼氨基酸生物合成途徑中催化酶的基因通常被選用作篩選標記基因。一個例子是Leu2基因,編碼β異丙基脫氫酶,是催化丙酮酸轉化為亮氨酸過程中的一種酶。

利用Leu2作為選擇標記基因,需要一種特殊的宿主酵母菌。宿主細胞必須是營養缺陷型突變體,含有突變的無功能的Leu2基因。這樣的Leu2-酵母無法合成亮氨酸,隻能在含有亮氨酸的培養基上生長。所以,利用宿主菌的這一表型進行轉化子的選擇是可行的,因為轉化子含有的質粒上攜帶一個Leu2基因拷貝,所以能夠在缺乏亮氨酸的情況下生長。在克隆實驗中,轉化後細胞被塗布在不含特定氨基酸的缺陷型培養基上,隻有轉化子細胞(即接受了質粒)才能夠生存並形成菌落,即發生了遺傳互補現象(圖 322)。 除了Leu2,色氨酸合成相關標記基因Trp1和嘧啶核苷酸合成相關基因Ura3(乳清酸核苷5′磷酸脫羧酶基因)也是酵母質粒載體中常用的選擇標記基因。

圖322利用Leu2作為酵母克隆中的篩選標記基因

2. 基於2μm質粒的載體:酵母遊離型載體(Yeast Episomal plasmids, YEps)

來源2μm酵母質粒的載體稱為酵母遊離型載體(YEps)。YEps或含有全部的 2μm 酵母質粒序列,或隻含有2μm酵母質粒的複製起始位點。YEp13就是後一種情況的一個例子(圖323)。

圖323酵母遊離型載體YEp13

YEp13除了含有2μm酵母質粒的複製起始位點和來自染色體的選擇標記基因Leu2之外,還含有pBR322質粒的全部序列,所以YEp13是一個穿梭質粒載體,既可在大腸杆菌細胞複製擴增,也可以在酵母細胞增殖。穿梭質粒是指一類具有兩種不同複製起點和選擇標記,因而可以在兩種不同類群宿主中存活和複製的質粒載體。大多數酵母克隆載體是穿梭載體,因為通常很難從轉化酵母菌落獲得重組DNA分子。當以遊離質粒存在時,較易從酵母細胞中提取重組DNA分子,但是一些酵母載體可能整合在酵母染色體中,這時就不可能進行純化了。這是一個不利條件。因為在許多克隆實驗中,重組DNA的純化對於鑒定重組DNA分子的構建是否正確非常重要,例如進行重組DNA的測序。因此,在酵母中進行克隆的標準過程是首先在大腸杆菌細胞中完成基因克隆實驗,並對重組質粒進行純化、鑒定,確認正確的重組DNA分子後再引入酵母細胞(圖324)。

YEps中Episomal表示YEp可以以質粒分子獨立存在,也可以整合在酵母染色體上。因為YEps載體中攜帶有Leu2基因,宿主酵母染色體上也有Leu2突變基因,兩基因序列相似,可以在這一位置發生同源重組,整個質粒整合進染色體。質粒可穩定存在,也可從染色體上重新解離(圖325)。

除了YEps載體外,酵母細胞還有其他類型的質粒載體,分別是酵母整合型載體(Yeast Integrative plasmids,YIps)和酵母複製型載體(Yeast Replicative plasmids,YRps)。

YIps酵母質粒載體基本為一個帶有酵母基因的質粒載體。以YIp5為例,將一個篩選標記基因Ura3插入到pBR322質粒序列中,由於不攜帶任何2μm質粒序列,YIp5質粒在酵母細胞中不能進行自主複製,隻能通過同源重組的方式整合進宿主染色體DNA,整合原理和YEps載體類似(圖326)。

圖324利用大腸杆菌酵母穿梭載體進行基因克隆

圖325通過載體和酵母染色體上的Leu 2基因,質粒可以重組進入酵母染色體

圖326酵母整合型載體YIp5和酵母複製型載體YRp7

YRps能夠作為獨立質粒自主複製,因為它們攜帶一段酵母染色體DNA序列,其中包括複製起始位點(ARS)。複製起始位點的位置臨近幾個酵母基因,其中包括一個或兩個可以用作選擇標記的基因。以複製型質粒YRp7(圖326)為例,它是由pBR322加酵母選擇性標記基因Trp1組成,並且包含與Trp1基因相鄰的染色體複製起始位點。

對於一個特定的克隆實驗,有三種因素決定哪種酵母載體為最合適。第一個是轉化效率。定義為每微克質粒DNA可以得到的轉化子數量。如果需要獲得大量的重組子或者待轉化的起始DNA量不足,高轉化頻率是非常必要的。YEps載體的轉化效率很高,每微克質粒DNA可以得到一萬到十萬個轉化子;YRps載體的轉化效率居中,每微克質粒DNA可以得到一千到一萬個轉化子;但YIps載體的轉化效率很低,在特殊條件下,每微克質粒DNA可以得到少於一千個轉化子,一般轉化條件下隻能獲得幾個轉化子。第二個重要因素是拷貝數。YEps載體和YRps載體均有較高的拷貝數,分別為20~50和5~100;而YIps載體通常隻有一個拷貝。如果實驗目標是從重組DNA轉化子細胞中獲取蛋白質,那麼基因的拷貝數就非常重要,基因拷貝數越高,蛋白的表達量也會相對提高。第三個重要因素是載體在細胞中的穩定性。YIps載體的轉化效率不高,拷貝數也很低,但是由於YIps載體的穩定性優於YEps和YRps,從基因組DNA上重新解離的概率極低。所以,在需要讓重組子在長期繼代培養中不會丟失的情況下,YIps載體是第一選擇。相比較而言,YRps重組載體非常不穩定,當子細胞以出芽生殖的方式脫離母細胞時,質粒趨向於聚集在母細胞中,所以子細胞是非重組的。YEps重組載體有著類似的問題,隨著對2μm質粒的生物學認識有所進步,近年來發展起來了更多的穩定的YEps。

3.1.4.2植物細胞表達載體

植物克隆載體產生於20世紀80年代,人們利用植物克隆載體創造了基因修飾植物,直到現在仍為人們關注的焦點。三種類型的載體係統已被不同程度地成功應用於高等植物,分別是基於農杆菌天然質粒的載體、植物病毒來源載體以及利用不同類型質粒DNA直接進行基因轉移。

1. Ti質粒來源的植物克隆和表達載體

農杆菌:大自然最小的遺傳工程師。

雖然高等植物中不存在自然產生的質粒,但一種細菌質粒——根癌農杆菌的Ti質粒在植物載體的產生過程中非常重要。根癌農杆菌是引起許多雙子葉植物產生冠癭病的土壤微生物。冠癭發生時,莖上的傷口允許細菌入侵植物細胞,細菌感染後會引起侵染部位細胞腫瘤式的增殖,形成冠癭瘤。

(1) Ti質粒的結構

根癌農杆菌造成冠癭瘤的發生是因為根癌農杆菌中Ti(tumourinducing,瘤誘導)質粒的存在。Ti質粒大小約200kb,攜帶了一係列與冠癭瘤生成相關的毒性基因。Ti質粒的一大特征是農杆菌侵染植物細胞後,Ti質粒的一部分DNA序列能整合進植物細胞的染色體DNA中。這一部分序列稱為TDNA(transfer DNA),片段大小根據菌株的不同,在15kb~30kb之間。轉移到植物細胞之後,TDNA可以在植物細胞染色體DNA中穩定存在,並且可以傳遞到子代細胞中(圖327)。Ti質粒上除了TDNA區以外,還有Ti質粒轉移區(tra),參與在不同農杆菌中的接合轉移;毒性區(vir),直接參與TDNA的轉移和插入植物染色體;DNA複製區(rep),參與Ti質粒DNA複製;冠癭堿代謝區,參與冠癭堿的分解和利用(圖328)。

圖327農杆菌Ti質粒的TDNA區域可以穩定整合到植物染色體基因組上並進行基因的表達

圖328農杆菌Ti質粒結構示意圖

① TDNA結構

TDNA中含有冠癭堿合成和植物激素(生長素和細胞分裂素)合成相關的基因,這些基因可以在植物細胞中表達,根癌農杆菌利用冠癭堿作為生長的碳源,產生的生長素和細胞分裂素促進被感染細胞加速分裂和擴增,生成冠癭瘤(圖328)。TDNA的左邊界和右邊界是TDNA從Ti質粒切開的位點,邊界包含25堿基的重複元件。

② 毒性區(vir)基因結構和功能

Ti質粒上vir區域的多個毒性基因,對於TDNA從Ti質粒轉移到植物宿主細胞起重要作用。vir區域長約40kb,由virA,virB,virC,virD,virE,virF和virG等七個操縱子組成。在有外源的酚類化合物如乙酰丁香酮誘導下,virA和virG的基因產物被活化從而促進其他毒性基因的表達。virB所編碼的蛋白質被輸送到細胞膜和周質中,形成TDNA從農杆菌運送到植物細胞的通道。virD基因包含兩個開放閱讀框,編碼virD1和virD2,其中virD2蛋白具有特異性的核酸內切酶活性,識別並切斷TDNA邊界重複序列。virE基因產物virE2蛋白為單鏈結合蛋白,可結合到單鏈TDNA分子上,幫助TDNA的轉運。在植物細胞中,virD2蛋白和由virE2蛋白包裹的單鏈TDNA一起組成成熟的TDNA轉移複合體,進入植物細胞的細胞核並整合到植物基因組染色體DNA上(圖329)。

圖329TDNA的轉運機製

(2) TDNA的轉運機製

在vir基因產物和植物細胞來源蛋白的共同作用下,TDNA的轉運可以分為八個步驟。① 在農杆菌染色體基因編碼蛋白和植物宿主細胞受體蛋白的幫助下,農杆菌細胞和植物細胞附著在一起;② 受傷的植物組織釋放乙酰丁香酮等小分子信號物質,virAvirG蛋白複合體作為受體結合乙酰丁香酮;③ virAvirG蛋白複合體自身被磷酸化激活的同時開放下遊的信號通路,誘導其他毒性基因的表達;④ virD2蛋白在TDNA的左右邊界切割Ti質粒分子,形成TDNA單鏈分子;⑤ TDNA單鏈分子和virD2形成不成熟的TDNA複合體,通過由virB蛋白組成的細胞間通道進入到植物宿主細胞;⑥ virE2蛋白結合TDNA單鏈形成成熟的TDNA複合體;⑦ 成熟TDNA複合體在宿主細胞來源,virD2相互作用蛋白的幫助下,通過核孔進入植物細胞的細胞核;⑧ TDNA複合體轉運到染色體並整合到染色體基因組DNA上,目前最後這一過程的機理還沒有完全揭示清楚(圖329)。

(3) Ti質粒的改造和應用

對農杆菌Ti質粒的研究使人們認識到Ti質粒作為載體的三大優點:① 宿主範圍廣,能轉化所有的雙子葉植物;② 整合到染色體上後成為染色體的正常組分永遠保留;③ 冠癭堿合成酶基因啟動子是一個強啟動子。但是,天然Ti質粒作為載體還存在一係列的問題,需要進行改造和修飾。首先去除生長素和細胞分裂素合成相關基因,形成非致瘤載體;需去除冠癭堿的合成基因,避免使植物最終產物的合成受到影響;需去除一些非必須DNA序列,方便外源DNA的插入;Ti質粒不能在大腸杆菌中複製,需要加入能在E. coli中複製的複製原點;需要加入能在植物和細菌細胞中進行選擇的標記。經過上述改造,理論上隻要把外源基因插入到TDNA序列中,農杆菌就可以將整合在TDNA序列中的外源基因導入到植物細胞並整合到宿主細胞染色體DNA中。但是因為Ti質粒分子量約200kb,很難對Ti質粒進行相關的基因操作。所以人們設計了兩套不同的策略,方便基因的克隆和Ti質粒來源載體在植物基因轉化中的應用。兩種策略分別為雙元載體係統和共整合載體係統。

a. 雙元載體係統的構建

TDNA獨立於Ti質粒的其他序列單獨存在時,也能在Ti質粒vir基因產物作用下轉移到植物細胞,由此建立了雙元載體係統。雙元載體係統包含兩個質粒,質粒A是缺少了TDNA序列的Ti質粒,質粒B是攜帶TDNA的較小質粒,兩個質粒在同一個農杆菌細胞中能進行正常的TDNA的基因轉移。大多常用農杆菌菌株內含有雙元載體係統的Ti質粒A(圖330),如AGL1和GV3101,隻需要對含有TDNA序列的較小質粒進行操作,應用常規方法在TDNA邊界序列內的特定位點插入外源基因即可。圖331為一個植物常用雙元載體的例子。載體上含有TDNA的左邊界(LB)和右邊界(RB)邊界序列,邊界序列內TDNA內的相關基因序列已被其他序列所取代,包括植物細胞內的篩選標記基因潮黴素抗性基因HptⅡ及多克隆位點。載體其他部分來自一般的質粒載體,包括pBR322來源的複製起始位點和大腸杆菌篩選標記基因卡那黴素抗性基因。這一載體首先是卸甲載體,即載體中不含TDNA序列內植物激素合成基因和冠癭堿的合成基因,TDNA轉入植物細胞後,

圖330雙元載體係統中的質粒A、質粒B簡圖和質粒B詳細結構

圖331植物常用雙元載體的實例

NOS終止子:根癌土壤杆菌的胭脂堿合酶多腺苷酸化信號。MCS:多克隆位點。LacZ:β半乳糖苷酶基因;HptⅡ:潮黴素抗性基因;35S啟動子和35S PolyA:煙草花葉病毒35S啟動子和多聚腺苷酸化信號;RB:TDNA的右邊界重複。LB:TDNA的左邊界重複。pVS1STA:來自質粒pVS1的穩定性蛋白質。對於農杆菌中穩定的質粒分離至關重要。pVS1REP:來自質粒pVS1的複製蛋白。允許在土壤農杆菌中複製低拷貝質粒。ori:質粒複製起始位點,允許在大腸杆菌中複製質粒。KanR:卡那黴素抗性基因,大腸杆菌和農杆菌中篩選標記基因。

就不會造成細胞分裂和擴增,形成冠癭瘤,便於轉基因植物的產生。另外,載體還是一個穿梭質粒載體,可以在大腸杆菌和農杆菌細胞中進行選擇和複製擴增,並且能夠使TDNA轉入到植物細胞中。

b. 共整合載體係統

共整合載體係統中含有一個大腸杆菌來源的小型質粒,但是質粒上整合進去一小段TDNA序列,並克隆進一個外源目的基因,當這個質粒和Ti質粒在同一個農杆菌細胞時,質粒載體上的TDNA序列和Ti質粒上TDNA序列發生同源重組,整合成一個完整質粒,待轉植物的外源基因整合在TDNA序列內(圖332)。含有重組質粒的農杆菌進行植物細胞侵染後,TDNA轉入植物細胞內。共整合載體係統目前應用不甚廣泛。

Ti質粒雙元載體在進行植物細胞轉化時,一般選用特定的植株組織和細胞進行農杆菌侵染,進行抗性篩選獲得轉基因細胞或愈傷組織,之後利用植株細胞的全能性,進行組織培養,獲得轉基因植株(圖333)。

(4) Ri質粒

除了根瘤農杆菌的Ti質粒,發根農杆菌的Ri質粒也被改造用於作為植株轉化載體。Ri質粒和Ti質粒類似,主要區別在於Ri質粒的TDNA轉移到植物細胞後不會引起冠癭病的發生,但會引起根係疾病,典型表型表現為高度分枝根係的大量擴增。通過生物技術已探索出轉化根在培養液中高密度成長的可能性,能夠作為從克隆的基因在植物中獲得大量蛋白質的一種潛在手段。

圖332共整合載體係統

圖333利用重組農杆菌轉染植物細胞獲得轉基因植株

(5) 農杆菌Ti質粒作為植物載體的缺點

農杆菌Ti質粒和Ri質粒來源載體轉化雙子葉植物的效率高,但不能轉化單子葉植物,單子葉植物玉米、水稻和小麥均是重要的農作物,能成功轉化至關重要。隨著載體係統的發展,單子葉轉化的瓶頸已經突破,但效率仍然不高。以Ti質粒作為載體,大多植株均需要通過組織培養的方式獲得轉基因植株,耗時較長且在不同植株的轉化率有很大差異。特別是在單子葉植物中,普通葉片作為外植體進行轉化時轉化率通常為零,一般需選用植物的幼胚進行轉化,將幼胚浸在農杆菌溶液中,在篩選培養基上獲得胚性愈傷組織,胚性愈傷組織易於分化生成完整植株。

由於農杆菌介導的植物轉化有一定的缺陷,所以植物轉化的其他方法也在發展,比如質粒DNA的直接轉化。

2. 利用植物病毒DNA作為表達載體的嚐試

λ和M13噬菌體基因組DNA改造後是大腸杆菌重要的克隆載體。大多數植物都能受到病毒感染,那麼病毒基因組可以被改造來做植物克隆載體嗎?如果可以的話,應用植物病毒作為載體在植物轉化方麵要比使用其他載體方便得多。因為可以通過簡單地把病毒核酸擦到葉子的表麵,即自然感染的方式來實現植物細胞的轉化。然後,病毒在整個植物體內傳播。絕大多數植物病毒擁有RNA基因組而不是DNA基因組。由於RNA難以操作,RNA病毒很難應用來作為載體。在植物病毒載體發展之初,隻有兩類DNA病毒感染高等植物;花椰菜花葉病毒和雙生病毒,但兩者都不適合直接用於基因克隆。

(1) 花椰菜花葉病毒載體

在1984年,利用植物病毒載體第一次成功地進行了植物基因工程實驗,即利用花椰菜花葉病毒載體攜帶新基因轉化蘿卜細胞。但是兩方麵的因素限製了這一病毒作為載體的實用性:第一個問題是花椰菜花葉病毒基因組的大小。和λ噬菌體一樣,存在外殼蛋白的包裝限製。即使刪除病毒基因組的非必需部分後,攜帶DNA的能力仍然非常有限。最近的研究表明,可能采用輔助病毒策略解決這一問題,類似於噬菌粒的應用。在該策略中,克隆載體是缺乏必需基因的花椰菜花葉病毒(CaMV)基因組DNA,意味著它可以攜帶較大的DNA插入片段,但本身不能直接感染植物。用載體DNA與正常的CaMV基因組同時接種植物,正常的病毒基因組提供所需的基因,將克隆載體包裝成病毒顆粒並通過植物進行傳播。雖然這種方法有很大的應用潛力,但它不能解決第二個問題,即花椰菜花葉病毒宿主範圍非常狹窄,這就限製了其作為載體的應用。隻能在芸苔屬蔬菜如蘿卜、白菜、花椰菜等植物中應用。然而,花椰菜花葉病毒來源的高活性啟動子CaMV 35S啟動子在植株克隆載體中應用非常廣泛,可以驅動一些篩選標記基因和報告基因的高效表達。

(2) 雙生病毒載體

雙生病毒的自然宿主包括玉米和小麥等作物在內的單子葉植物,所以很有希望成為這些作物的潛在載體。但是雙生病毒作為載體在使用上存在一個問題是在感染周期中,雙生病毒的基因組會進行重排和缺失,已經插入了載體的外源DNA序列也會遭到破壞。這一明顯缺點使其很難改造成為成功的載體。但多年來的研究已經解決了這一問題,雙生病毒目前在植物基因克隆中有專門的應用。其中的一個應用是病毒誘導的基因沉默(Virus Induced Gene Silencing, VIGS),即一種用於研究單個基因功能的方法。它指攜帶目標基因片段的病毒侵染植物後,可誘導植物內源基因沉默、引起表型變化,進而根據表型變異研究目標基因的功能。這種方法利用了一種植物用來保護自己免受病毒攻擊的自然防禦機製,稱為RNA沉默,這種機製可以導致病毒基因的降解。如果包含有一個外源基因的雙生病毒基因組的病毒RNAs在植物細胞被轉錄,將誘發RNAi,那麼不僅病毒轉錄物(包含外源基因)被降解,來自植物細胞基因的mRNA拷貝也被降解。因此,植物細胞內基因表達沉默,可以通過研究基因失活對植物表型的影響來研究基因功能。

植物病毒DNA來源載體多屬於外源基因的瞬時高效表達載體,可以在植物中瞬時過量表達目的基因或瞬時沉默目的基因。因為植物病毒來源載體不能和Ti質粒來源載體一樣整合到植物細胞的基因組DNA上,不能傳代。但植物病毒作為載體仍有下列優點:① 病毒載體在宿主細胞中多輪複製,使外源基因高水平表達;② 病毒增殖速度快,外源基因的拷貝數可短時大量增加;③ 有些病毒基因組小,易於重組遺傳操作;④ 可通過接種方式感染植物,方法簡單高效;⑤ 植物病毒種類繁多,侵染宿主範圍較為廣泛。

除CaMV病毒和雙生病毒外,還有兩種植物基因功能研究過程中常用的病毒載體,分別來自豌豆早褐病毒(Pea Early Brown Virus, PEBV)、大麥條狀花葉病毒(Barley Stripe Mosaic Virus, BSMV)。

豌豆早褐病毒(PEBV)為雙鏈RNA病毒,將其cDNA序列克隆進入農杆菌TDNA區,用煙草花葉病毒35S啟動子驅動。外源基因插入pCAPE2載體的多克隆位點。可用於基因的表達抑製(VIGS)或過量表達。PEBV可感染豌豆、山黎豆和煙草等,在研究基因功能方麵發揮了很大作用,如在豌豆中對葉形和花的發育相關基因的功能研究。圖334中顯示的為通過VIGS降低基因PEAM 4的表達,使豌豆花的形態發生產生異常。

圖334豌豆早褐病毒(PEBV)雙鏈RNA病毒載體的應用

大麥條狀花葉病毒為三條正鏈的RNA病毒,分為α,β,γ三條鏈。將由外源基因八氫番茄紅素脫氫酶(PDS)基因構建的發夾結構和γ鏈上γb蛋白基因融合,成功在單子葉植物大麥上抑製了PDS基因的表達。植物表現白化表型。

3. 植株病毒載體的改進

構建雙元VIGS載體並通過農杆菌介導方式進行重組病毒接種,是VIGS技術發展和優化的一個裏程碑式進展。該方法以既能在大腸杆菌中繁殖又可以通過農杆菌轉化植物的雙元載體,如以pCAMBIA、pGreen等為基礎,首先將病毒全長cDNA克隆到真核啟動子及終止子之間,再將其植入到載體TDNA的左右邊界之間。這樣,當雙元載體通過農杆菌介導轉化植株以後,在寄主細胞內通過真核啟動子轉錄出病毒的侵染性克隆,隨著病毒的複製與移動,其攜帶的基因片段便可誘導同源基因的係統沉默。

另外,最近的研究發現,部分VIGS載體病毒誘導的PTGS能夠通過種子傳遞給後代植株,並且植株的遺傳基因並未發生改變。BSMV介導的VIGS被證明能夠在大麥和小麥中至少傳遞6代。

3.1.4.3動物細胞表達載體

同噬菌體和植物病毒一樣,病毒分子生物學的發展為生物工程領域研究拓展了思路,提供了有效的方法和工具。目前以動物病毒為基礎設計的基因克隆及表達載體在外源基因於異源細胞係統中高效表達,利用構建疾病動物模型基因敲除動物,進行基因功能研究和基因治療等多個方麵有廣泛應用。

1. 猿猴空泡病毒40來源載體

猿猴空泡病毒40(Simian vacuolating virus 40,SV40)載體是在1979年第一個在動物細胞中應用的基因克隆載體。SV40病毒的基因組是一種環形雙鏈的DNA,分子質量較小,很適於基因操作。它是第一個完成基因組DNA全序列分析的動物病毒,對其複製及轉錄方麵的特性也有了相當深刻的了解。這些都為發展SV40病毒作為基因克隆的載體奠定了很好的基礎。SV40病毒基因組內含有控製DNA複製等的早期基因以及控製衣殼蛋白合成的晚期基因,經常使用替代型載體的方法是將外源基因替換晚期基因的部分序列來構建載體,在輔助病毒的幫助下形成含有外源DNA的病毒顆粒(圖335)。野生型的SV40病毒顆粒的包裝範圍相當嚴格,

超過其基因組大小(5.2kb)的重組DNA就不能夠被包裝為成熟的病毒顆粒,所以其克隆片段的大小非常有限。而且SV40病毒還存在著寄主細胞的局限性,隻能在受體細胞中增殖,並最終導致寄主細胞的死亡,這樣就不能作長期的培養使用。

圖335SV40病毒基因組結構和SV40替換型載體

以SV40載體為基礎,發展了帶有SV40複製起點的質粒型瞬時表達穿梭質粒載體(圖336)。載體上帶有大腸杆菌複製起始位點和氨苄抗性標記基因。SV40複製起始位點及早期基因的增強子和啟動子序列以及SV40轉錄終止序列和多聚腺苷酸位點序列。如圖336所示為能夠在動物細胞中瞬時表達dhfr(二氫葉酸還原酶)基因的表達載體。

圖336SV40和質粒融合穿梭載體pSV2dhfr

該載體可在大腸杆菌細胞內複製,也可直接轉染哺乳動物細胞,因為不通過病毒顆粒的包裝,所以可插入較大的DNA片段,轉入動物細胞不發生裂解。當重組DNA分子轉入COS細胞係(COS細胞:將一個複製起點部位缺失的SV40基因組整合到猴細胞的染色體上所形成的細胞係。早期基因表達可產生T和t抗原,但由於沒有複製起點,SV40 DNA不能複製,也就不能產生晚期基因產物,故COS細胞可積累T抗原)後。在COS細胞所提供的T抗原的幫助下,能大量複製,其拷貝數可達20萬~40萬,並高效表達載體上的外源基因。由於轉染質粒的複製毫無節製地不斷進行,直至細胞可能由於無法忍受它的染色體外複製如此大量的DNA而最終死亡,因而這一係統是瞬時表達係統。

2. 逆轉錄病毒來源載體

逆轉錄病毒是一類RNA病毒,其基因組是由2條相同的單鏈RNA分子組成,基因組大小在8kb~11kb之間。逆轉錄病毒經寄主細胞表麵的受體蛋白識別後進入細胞,然後在自身基因組編碼的反轉錄酶的作用下,以基因組RNA為模板反轉錄出雙鏈DNA。雙鏈DNA能夠隨機整合到寄主細胞的染色體上,隨著寄主細胞的複製而複製。這類載體主要源於莫洛尼(Moloney)鼠白血病病毒(murine leukemia virus, MoMLV)。MoMLV基因組結構如圖337所示。

圖337MoMLV基因組結構

5′LTR:5′長末端重複序列,含轉錄起始信號及轉錄增強子;Ψ:非編碼區,病毒顆粒包裝的信號序列;gag:病毒的外殼結構蛋白,與病毒RNA結合;pol:逆轉錄酶及整合酶基因;env:病毒外膜糖蛋白;3′LTR:3′長末端重複序列。

逆轉錄病毒載體的構建順序為圖338所示,將逆病毒DNA克隆到質粒pUC係列載體上,去掉gag、pol、env三個基因的大部或全部序列,替換為外源基因,保留5′LTR,Ψ和3′LTR,插入選擇標記基因新黴素抗性基因NeoR。

圖338逆轉錄病毒載體的構建順序

重組的逆轉錄病毒質粒載體可在大腸杆菌細胞內增殖並將純化的DNA轉染動物細胞,篩選出穩定的轉化子,轉化細胞能表達外源基因,並合成重組逆病毒的RNA分子,問題在於如何將產生的重組病毒的RNA分子包裝到病毒顆粒中。有兩種策略可以解決這個問題:第一是利用輔助病毒超感染轉化細胞,由輔助病毒提供包裝病毒所需的結構蛋白;第二是利用包裝細胞係,包裝細胞係的染色體上整合了一個缺失了Ψ序列的逆病毒DNA,包裝細胞係能組成型表達逆轉錄病毒的全部蛋白質,但不能包裝缺失了Ψ序列的RNA。將純化的DNA轉染包裝細胞係,產生有感染能力的重組逆轉錄病毒顆粒。

3. 腺病毒(adenovirus, Ad)來源載體

Ad廣泛分布於呼吸道,為一DNA雙鏈無包膜病毒,基因組長約36kb,基因組結構如圖339所示。ITR:反向重複序列;E1E4:早期基因,與病毒基因組複製的起始和晚期基因的表達調控有關;L1L5:晚期基因,病毒包裝蛋白;Ψ:包裝信號;IVa2和VA:病毒型RNA聚合酶Ⅲ的亞基基因,與宿主細胞的亞基裝配成雜合的RNA聚合酶Ⅲ。

圖339腺病毒(adenovirus, Ad)基因組結構

ITR和Ψ是腺病毒基因組複製和包裝必不可少的部分,除此之外的病毒基因組均可被置換,這樣載體的總長不到1kb。這種病毒載體容量非常大,最高可達36kb,細胞毒性和免疫原性大幅度減弱,而且目的基因的表達時間大大延長,在輔助病毒幫助下產生重組腺病毒顆粒。以腺病毒為基礎構建基因轉移載體具有以下優點:(1) 人類是腺病毒的天然宿主,所以比較安全。(2) 該病毒宿主範圍廣泛,能將目的基因轉移到分裂或靜息的細胞中。(3) 可原位感染。將攜帶外源基因的重組Ad載體直接注入組織中,可以原位感染組織細胞。特別是肺,可經口服、噴霧、氣管內滴注等途徑進行治療。(4) 由於Ad感染細胞時其DNA不整合到宿主染色體中,潛在的致癌危險小。(5) 外源基因表達水平較高,滴度高(>1011cfu\/mL),在體外穩定,易於製備與純化。腺病毒載體的不足之處在於:(1) 缺乏特異性,幾乎可以感染所有的細胞。(2) 腺病毒基因組不能整合到宿主細胞基因組上,不能持續表達,外源基因易隨著細胞分裂或死亡而消失,表達時間短暫,屬於瞬時表達係統。

4. 腺相關病毒(adenoassociated virus, AAV)來源載體

AAV屬微小病毒科,是目前已知動物病毒載體中最簡單的線狀單鏈DNA病毒,基因組大小在4.7kb~6kb之間,無包膜,病毒體為20麵體。AAV是天然複製缺陷型病毒,需要腺病毒或單純皰疹病毒輔助感染。目前廣泛應用的腺相關病毒載體主要基於腺相關病毒(AAV2),AAV2基因組有4680個核苷酸,含有3個啟動子P5、P19、P40,2個開放式閱讀框(openreading frame, ORF)rep、cap和位於基因組兩端的末端反向重複序列ITR。載體的構建策略同樣為刪去複製和包裝信號之外的其他非必需序列,構建替換型病毒載體。

AAV在基因治療的應用中有如下優點:(1) 屬人源非致命性病毒,不引起明顯的炎症和免疫反應。(2) 可以感染分裂期和非分裂期的多種細胞。(3) 野生型AAV能穩定整合入人的19號染色體S1位點,能較穩定地存在,從而避免了其他病毒隨機整合可能引起的抑癌基因失活和原癌基因激活的危險。(4) AAV介導的外源基因可以持續穩定表達,並可受到周圍基因的調控,重組可能小。AAV的缺點主要是外源基因容量小,製備較複雜,難於大量生產,滴度也相對不高,並需要去除輔助病毒的汙染。AAV被公認為是最安全的病毒載體,在基因治療和疫苗製備等領域研究中受到廣泛重視。

5. 杆狀病毒(baculo virus)來源載體

杆狀病毒是以節肢動物為唯一宿主的雙鏈DNA病毒。昆蟲杆狀病毒基因表達係統成功開發於20世紀90年代後期。在多角體蛋白基因的強啟動子控製之下,杆狀病毒可使許多真核目的基因得到高效的表達。杆狀病毒載體表達的蛋白質在功能、免疫反應性和免疫原性等方麵都與天然的蛋白質相似,被用來表達各種酶類、跨膜及分泌蛋白。

杆狀病毒在自然條件下不能感染脊椎動物,生物安全性好。此外,杆狀病毒還具有可插入大片段,容易操作,無細胞毒性和易得到高滴度的病毒粒子等優點。

此外,病毒載體還包括單純皰疹病毒(herpes simplex virus, HSV)載體、痘苗病毒(vaccinia virus, VV)載體及AdMLV雜交病毒載體和AAVAd雜交病毒載體等雜合病毒載體(hybird or chinmeric vectors)。

3.1.4.4果蠅中的P轉座因子來源載體

果蠅(Drosophila melanogaster)是生物學家使用的最重要的模式生物之一。1910年,遺傳學家摩爾根開始在有不同的眼睛顏色、身體形狀和其他遺傳性狀的果蠅間進行遺傳雜交,揭示了基因遺傳的連鎖規律,目前這些實驗技術仍然用於在昆蟲和其他動物中進行基因定位研究。這是果蠅首次被確認具有模式生物的應用潛力。研究發現,控製蒼蠅整個體節發育的同源異型基因與哺乳動物中的等效基因是密切相關的。所以,黑腹果蠅可被用作一種人類發育過程的研究模型。在現代生物學中,果蠅的重要性不言而喻,發展在這個有機體中進行基因克隆的載體也勢在必行。

果蠅載體的發展和細菌、酵母、植物和哺乳動物等係統的載體有著不同的路線。果蠅細胞中沒有已知的質粒。雖然果蠅和所有生物一樣容易感染病毒,但病毒沒有被用來作為克隆載體的基礎。果蠅的克隆載體來源於一種稱為P元件的轉座子。轉座子是可以從細胞染色體的一個位置移動到另一個位置的短的DNA片段(通常長度小於10kb)。P元件是果蠅中轉座子的幾種類型之一,長度為2.9kb,包含三個短基因,在元件的兩端含有反向重複序列。這些基因編碼轉座酶,可以催化轉座子的轉移,元件兩端的反向重複序列為轉座酶的識別位點。P元件可以從染色體的一個位點轉移到一個位點,可以從一個染色體轉移到另一個染色體,也可以從含有P元件的質粒轉移到染色體位點(圖340b)。最後一種情況是P元件可以作為載體的關鍵依據。構建的質粒載體係統包含兩個質粒載體,分別含有兩個P元件:一個P元件含有完整的邊界序列,外源待克隆基因可以插入P元件內部,替換轉座酶基因或通過內部的限製性酶切位點插入使其失活,並且含有果蠅篩選標記基因(圖340c);另一個P元件含有完整的轉座酶基因,但是缺失了末端反向重複序列,不能發生轉座,稱為折翼P元件(圖340c)。一旦外源基因被克隆到上述載體中,可通過顯微注射的方法將質粒DNA注射到果蠅胚胎。折翼P元件產生的轉座酶基因能夠催化攜帶外源基因的P元件從質粒到宿主細胞染色體DNA的轉移。被轉化的種係胚胎細胞發育成成蟲,成體果蠅所有細胞中將攜帶有目的基因的拷貝。P元件為載體進行基因克隆開始於20世紀80年代,對果蠅遺傳學的發展有重要貢獻。

圖340果蠅P元件載體的應用

a. P元件結構;b. 質粒攜帶的P元件轉座到果蠅染色體DNA;c. 無活性P元件(包括轉座酶基因失活P元件和缺失末端TIR序列的折翼P元件)

現在應用比較成熟的P元件載體的例子為pUAST載體係統,可以良好、高效地進行轉基因果蠅製備和基因表達控製。完整的pUAST係統包含兩個載體:一個載體被稱為pUAST質粒,包含兩個P元件末端重複,包括待轉座的區域或基因;另一個載體稱為輔助質粒或轉座酶質粒,編碼P轉座酶。pUAST質粒的結構如圖341所示。

圖341pUAST果蠅基因表達載體

當pUAST與轉座酶質粒共轉染靶細胞時,輔助質粒產生的轉座酶識別pUAST質粒上的兩個P元件末端重複序列,然後將待轉座區和兩個P元件末端重複序列插入到宿主基因組中。

通過將pUAST和輔助質粒共注射到果蠅早期胚胎中可以產生轉基因果蠅。以致產生攜帶靶基因的轉基因後代。P轉座酶僅在短時間內表達,並且隨著輔助質粒的丟失,轉座子便永久性地整合在宿主基因組中。pUAST載體上的mini white基因的表達,可以使果蠅的眼色發生變化,是鑒定轉基因果蠅成功與否的標記基因(圖341)。或者也可以使用PCR或其他分子方法鑒定轉基因細胞或動物。

在pUAST係統中,目的基因將被克隆到合成誘導型啟動子的下遊,該啟動子由5個串聯排列的GAL4結合位點(5xUAS)和Hsp70 TATA box組成。目的基因依賴於GAL4的表達,GAL4蛋白在與pUAST質粒上的UAS位點結合後會激活目的基因的轉錄。因此,在沒有GAL4表達的情況下,

目的基因保持沉默,但是通過與表達GAL4的果蠅係雜交後,在GAL4表達的細胞中,目的基因會被轉錄激活。

3.1.5大容量基因組文庫載體

之前介紹的質粒載體、噬菌體載體等,具有最大容量的載體為粘粒載體,可容納45kb左右的外源基因片段。雖然載體容量在粘粒中有很大的提升,但是還不能滿足基因組文庫構建的要求,特別是對一些具有龐大基因組的物種。基因組文庫的構建在早期的基因組序列分析中有重要作用。基因組文庫構建所需要載體一般需要達到200kb的容量,一些人工染色體載體應運而生,包括P1人工染色體PAC(P1derived artificial chromosome)、細菌人工染色體BAC(bacterial artificial chromosome)和酵母人工染色體YAC(yeast artificial chromosome)。

3.1.5.1PAC載體

PAC載體由Sternberg在1990年創製。PAC載體是由P1噬菌體改造來的,具有高容量,能夠容納100kb~300kb的DNA片段。PAC載體含有包裝位點(pac):體外包裝重組子成為噬菌體粒子所必需;兩個同向排列的LoxP位點:能被噬菌體重組酶(cre基因的產物)所識別並進行重組;另外還有P1和質粒DNA的複製子、卡那黴素抗性基因等(圖342)。

圖342PAC載體的克隆策略

載體經過酶切後形成長短兩個臂,和經過消化的插入DNA片段連接形成重組DNA分子,在體外包裝係統的幫助下,識別pac為包裝信號,將重組DNA包裝進噬菌體頭部,加上尾部蛋白形成完整的噬菌體顆粒。包裝好的噬菌體顆粒侵染具有Cre蛋白酶活性的宿主菌,進入宿主菌後,Cre酶催化兩個LoxP位點件的重組,形成環形的質粒分子,在大腸杆菌中利用質粒複製子進行複製,還可誘導以P1裂解複製子進行複製,獲得較多拷貝(圖342)。這種載體的包裝容量上限在100kb,如圖343的質粒pAD10SacBⅡ。在pAD10SacBⅡ中,使用ScaⅠ和BamHⅠ兩種限製性內切酶將環形質粒酶切為長臂和短臂,並和經Sau3A和MboⅠ部分酶切的基因組DNA片段進行連接,連接產物經病毒克隆包裝後侵染大腸杆菌,感染的大腸杆菌塗布在含有卡那黴素和5%蔗糖的培養基上進行篩選。SacB基因編碼果聚糖蔗糖酶,含有這個基因的大腸杆菌不能在含有蔗糖的培養基上進行生長,從而通過插入失活的方法篩選重組體。隨著電擊轉化宿主細胞的技術進步,人們在pAD10SacBⅡ載體的基礎上進行了進一步的改造,獲得pCYPAC1載體,載體大小隻有約20kb,去除了pac包裝位點和一個LoxP位點,不再通過噬菌體顆粒包裝和侵染宿主細胞的方法進行轉化,而是通過電擊轉化重組DNA分子進入宿主細胞,大大提高了克隆容量,使載體能夠克隆達到300kb的DNA片段(圖343)。

圖343PAC載體實例:pAD10SacBⅡ和pCYPAC1載體

3.1.5.2BAC載體

圖344BAC載體實例pBeloBAC11

細菌人工染色體(bacterial artificial chromosome,BAC)是指一種以F質粒(Fplasmid)為基礎建構而成的細菌染色體克隆載體,用來克隆150kb左右大小的DNA片段,最多可容納300kb。BAC載體的大小約7.5kb,其本質實際上是一個質粒克隆載體,如圖344所示的BAC載體pBeloBAC11。這一載體與常規克隆載體的核心區別在於其複製單元的特殊性。BAC複製單元來自F質粒。包含嚴謹型控製的複製區(oriS);啟動DNA複製的ATP驅動的解旋酶(repE)等組分。parA、parB、parC為確保低拷貝質粒精確分配到子代細胞的3個基因座。載體的標記基因是氯黴素抗性基因(CMR);可以通過α互補原理篩選重組子。設計了用於回收克隆DNA的NotⅠ酶切位點(2個),並帶有驅動克隆DNA片段體外轉錄的SP6和T7啟動子。通過電擊轉化重組DNA分子進入宿主細胞。

3.1.5.3YAC載體

YAC(酵母人工染色體)克隆載體是最早構建成功的人工染色體克隆載體。這種人工染色體克隆載體實際上是一種“穿梭”克隆載體,含有質粒克隆載體所必備的第一受體(大腸杆菌)源質粒複製起始位點(ori),還含有第二受體(如酵母菌)染色體DNA著絲點、端粒和複製起始位點的序列,以及合適的選擇標記基因。這樣的克隆載體在第一受體細胞內可以按質粒複製形式進行高拷貝複製。這種克隆載體在體外與目的DNA片段重組後,轉化第二受體細胞,可在轉化的細胞內按染色體DNA複製的形式進行複製和傳遞。能容納長達1000kb甚至3000kb的外源DNA片段。常用YAC載體pYAC4的大小為11.4kb(圖345),主要結構包括:① 兩個可在酵母菌中利用的選擇基因,URA3和TRP1(色氨酸合成基因);② 酵母菌著絲粒序列(centromere4,CEN4),可以保證細胞分裂時染色體正確分配到子代細胞中;③ 一個自主複製序列(ARS),染色體DNA起始複製的位點;④ 兩個來自嗜熱四膜蟲(Tetrahymenna thermophilp)的末端重複序列(TEL),以保持重組YAC為線狀結構並保證染色體正確複製和免於核酸酶的降解;在兩個末端序列中間,有一段填充序列(HIS3),以便pYAC4在細菌細胞中穩定擴增;⑤ Amp 抗性及細菌質粒複製原點;⑥ 一個EcoRⅠ克隆位點,該位點位於酵母菌選擇標記基因SUP4 tRNA基因內。

圖345酵母人工染色體pYAC4

YAC載體的克隆過程如圖346所示,首先用EcoRⅠ和BamHⅠ對載體進行雙酶切,獲得均具BamHⅠ和EcoRⅠ切割末端的兩個DNA片段(雙臂),隨後把兩端具EcoRⅠ切割末端的外源DNA與此雙臂連接,構成酵母人工染色體。用電擊儀進行電擊轉化,把此人工染色體轉化酵母受體細胞,使人工染色體DNA隨著酵母細胞的裂殖而擴增。重組子的篩選選用SUP4基因。SUP4基因編碼赭色抑製TRPtRNA,抑製赭色菌落表型(成為白色)。不含外源DNA片段的pYAC4載體轉化酵母菌,轉化子的菌落呈白色。帶有插入的外源DNA片段的pYAC4重組載體,其SUP4基因已經失活,轉化子形成赭色菌落。

圖346酵母人工染色體pYAC4的克隆策略

3.2工具酶

獲得重組分子時,載體以及被克隆的DNA必須在特定的位點被切割,然後以預設的方式連接在一起。切割和連接是DNA操作技術的兩個最重要步驟,分別為限製性內切酶和連接酶所催化。除這兩種工具酶之外,基因工程中參與核酸擴增和修飾的工具酶種類繁多,可以對核酸分子進行縮短、延長、降解,可以通過添加或除去特定的化學基團對核酸分子進行修飾。可以從RNA分子合成DNA分子,也可以從DNA合成RNA分子,這些操作,全部可在試管內進行,是DNA的生物化學研究、基因組結構、基因的克隆以及基因表達調控等研究的技術基礎。

幾乎所有的DNA操作技術都利用純化酶。在細胞中,這些酶本來參與諸如DNA複製和轉錄、對不需要的或外來DNA進行分解(例如侵入病毒DNA),修複突變的DNA和不同DNA分子之間的重組等重要過程。這些酶從細胞提取液中純化後,大多可以催化原初的反應或在人工條件下催化相似的反應。酶的催化反應往往很簡單,但絕大多數不可能通過標準化學方法合成。因此,酶的純化對基因工程操作至關重要。目前,各種高純度酶的生產、銷售已經實現完全商業化,滿足了分子生物學家的各種需要。多家公司生產的各種工具酶已被廣泛使用。

根據核酸工具酶催化的反應種類,可以把DNA工具酶分成四大類:

(1) 核酸酶:對DNA分子進行酶切、縮短或降解的一類核酸酶。

(2) 連接酶:催化DNA分子間形成新的磷酸二酯鍵,使兩個分子連接成一個分子。

(3) 聚合酶:進行DNA分子的複製和擴增。

(4) 修飾酶:在DNA分子上去除或添加化學基團。

對上述工具酶進行分類時,有兩個前提。第一個前提是雖然分類時各種酶各有歸屬,但是有一些酶所具有的酶活性可能跨越兩到三個分類。比如有些DNA聚合酶同時具有聚合酶活性和核酸酶活性,可以在合成新的DNA鏈的同時從5′或3′端對DNA分子實施降解。第二個前提是應該認識到,和DNA工具酶類似,許多類似的酶也可以作用於RNA。比如,一個應用實例即為前麵講述DNA提取純化時核糖核酸酶去除DNA中RNA汙染,雖然一些RNA工具酶也應用於基因克隆中。在後麵的章節中提到,我們一般隻講述DNA工具酶。

3.2.1核酸酶

核酸酶通過打破DNA鏈中的連接相鄰兩個核苷酸間的磷酸二酯鍵來降解DNA分子。核酸酶有兩種不同的類型:核酸外切酶和核酸內切酶。

3.2.1.1核酸外切酶

核酸外切酶是一類能從多核苷酸鏈的一端開始按序催化水解3、5磷酸二酯鍵,降解核苷酸的酶。其水解的最終產物是單個的核苷酸(DNA為dNMP,RNA為NMP)(圖347)。

按作用的特性差異可以將其分為單鏈的核酸外切酶和雙鏈的核酸外切酶。核酸外切酶又可按照作用的方向分為5′→3′核酸外切酶和3′→5′核酸外切酶。5′→3′核酸外切酶從5′端開始逐個水解核苷酸;3′→5′核酸外切酶從3′端開始逐個水解核苷酸。有些核酸酶同時具有5′→3′和3′→5′核酸外切酶活性。單鏈的核酸外切酶包括大腸杆菌核酸外切酶Ⅰ(ExoⅠ)和核酸外切酶Ⅶ(ExoⅦ)。核酸外切酶Ⅶ(ExoⅦ)能夠從5′末端或3′末端呈單鏈狀態的DNA分子上降解DNA。雙鏈的核酸外切酶包括大腸杆菌核酸外切酶Ⅲ(ExoⅢ)和來源於交替單胞菌(Alteromonas espejiana)Bal31核酸酶。Bal31核酸酶能從DNA雙鏈的5′和3′端同時降解DNA,隨著Bal31核酸酶作用時間的增加,DNA片段長度隨之縮短。核酸外切酶Ⅲ(ExoⅢ)隻能作用於DNA雙鏈分子的3′端,形成單鏈的DNA分子(圖348)。

a

5′GAATTGTACAATATTAT3′

3′CTTAACATGTTATAATA5′

外切酶消化

G T

5′AATTGTACAATATTA3′

3′TTAACATGTTATAAT5′

CA

外切酶消化

A A

5′ATTGTACAATATT3′

3′TAACATGTTATAA5′

TT

b

5′GAATTGTACAATATTAT3′

3′CTTAACATGTTATAATA5′

內切酶消化

5′GAATTGTACAATATTAT3′

3′CTTAACATGTTATAATA5′

內切酶消化

5′GAATTGTACAATATTAT3′

3′CTTAACATGTTATAATA5′

圖347核酸酶的降解方式

a. 核酸外切酶;b. 核酸內切酶

a Exo Ⅶ

5′GAATTGTACAA

ATGTTATAATA5′

單鏈5′→3′

外切酶活性

5′AATTGTACAA

ATGTTATAAT5′

ACAATATTAT3′

3′CTTAACATGTTA

單鏈3′→5′

外切酶活性

ACAATATTA3′依次降解隻

餘雙鏈DNA

3′TTAACATGTTA

b Bal31

5′GAATTGTACAATATTAT3′

3′CTTAACATGTTATAATA5′

雙鏈5′→3′

和3′→5′

外切酶活性

GT

5′AATTGTACAATATTA3′

3′TTAACATGTTATAAT5′依次完全

降解

CA

C ExoⅢ

5′GAATTGTACAATATTAT3′

3′CTTAACATGTTATAATA5′

雙鏈3′→5′

外切酶活性

T

5′GAATTGTACAATATTA3′

3′TTAACATGTTATAATA5′依次降解隻

餘單鏈DNA

C

圖348核酸外切酶實例

a. ExoⅦ;b. Bal31;c. ExoⅢ

3.2.1.2核酸內切酶

核酸內切酶能夠破壞DNA分子內部的磷酸二酯鍵。同核酸外切酶一樣,有些核酸外切酶能作用於單鏈DNA分子,如S1核酸酶,可降解DNA單鏈以及雙鏈DNA分子內部的缺刻部分(圖349a)。有些核酸內切酶既可作用於單鏈,也可以降解雙鏈DNA,如DNaseⅠ(圖349b)。有些核酸內切酶隻能作用於DNA雙鏈,如Ⅱ型限製性核酸內切酶隻在特定位點切割DNA分子。後文將詳細敘述(圖349c)。

a S1核酸酶

5′GAAT↓TG↓TACAT3′5′GAATTGTACAT3′

5′GTACAATATTATA

3′CATGTTATAATATG

5′GAATTACT3′

3′CTTAA↓C↓A↓TGA5′

5′GAATTACT3′

3′CTTAATGA5′

5′GTACAATATTAT3′

3′CATGTTATAATA5′

b DNaseⅠ

5′GAAT↓TG↓TACAA3′5′GAATTGTACAA3′

5′GGACT↓TCACT3′

3′CCTGA↑AGTGA5′

5′GGACTTCACT3′

3′CCTGAAGTGA5′

c Ⅱ型限製性內切酶

5′GGATA↓TCACT3′

3′CCTAT↑AGTGA5′

5′GGATATCACT3′

3′CCTATAGTGA5′

5′GGA↓ATTCACT3′

3′CCTTAAG↑TGA5′

5′GGAATTCACT3′

3′CCTTAAGTGA5′

圖349核酸內切酶實例

a. S1核酸酶;b. DNaseⅠ;c. Ⅱ型限製性內切酶

3.2.1.3特殊核酸內切酶——限製性核酸內切酶

限製性內切酶的純化和使用可以讓分子生物學家精確且可重複性地切割DNA分子。這些酶的發現使W. Arber, H. Smith,和D. Nathans三位科學獎獲得了1978的諾貝爾化學獎,是基因工程發展的重大突破之一。

1. 限製性內切酶的發現和功能

限製性核酸內切酶最初發現於20世紀50年代初,當一些細菌菌株被證明對噬菌體感染有免疫力,這被稱為宿主控製的限製現象。限製機製雖不複雜,但揭示其詳細機理也耗費了20年的時間。限製是由於細菌可產生一種酶,能夠降解外來入侵的噬菌體DNA,使噬菌體不能複製並合成新噬菌體顆粒。因為宿主DNA分子上攜帶甲基化位點,使酶不能發揮作用,從而使宿主自身的DNA免於降解。這些降解酶被稱為限製性內切酶,能在大多或所有的細菌種類被合成。迄今為止,已經分離出近4000種不同的酶,目前已有600多種酶用於實驗室。根據限製酶的結構,輔因子的需求差異與作用方式,可將限製酶分為三種類型:第一型(Type Ⅰ)、第二型(Type Ⅱ)及第三型(Type Ⅲ)。

第一型限製酶同時具有修飾(modification)及識別切割(restriction)的作用;具有識別(recognize)DNA上特定堿基序列的能力,通常其切割位點(cleavage site)距離識別位點(recognition site)可達數千個堿基之遠。例如:EcoB、EcoK。

第二型限製酶隻具有識別切割的作用,修飾作用由其他酶完成。所識別的位置多為短的回文序列(palindrome sequence);所剪切的堿基序列通常為所識別的序列。例如:EcoRⅠ、HindⅢ。

第三型限製酶與第一型限製酶類似,同時具有修飾及識別切割的作用。可識別短的不對稱序列,切割位與識別序列約距24~26個堿基對。例如:HinfⅢ。

Ⅰ型和Ⅲ在基因工程中隻有有限的作用,而Ⅱ型限製性內切酶是在基因克隆中非常重要的切割酶。

2. Ⅱ型限製性內切酶在特定的核苷酸序列切割DNA

Ⅱ型限製性內切酶的核心特征是每個酶都有一個特定的識別序列,並隻在此位點切割DNA分子。例如,限製性內切酶稱為PvuⅠ(從普通變形杆菌中分離)隻在六聚體CGATCG位點切割DNA;相反,另一種從相同的細菌分離的酶PvuⅡ,具有不同的六聚體切割位點,CAGCTG。

大多限製性內切酶識別六聚體位點,但也有一些酶的識別和切割位點是四、五、八,甚至更長的核苷酸序列。如酶Sau3A(來自金黃色葡萄球菌菌株3A)識別切割位點為GATC,而AluⅠ(Arthrobacter luteus)位點為AGCT。也有一些限製性內切酶識別兼並性序列的例子,這意味著酶可以對一組DNA位點中的任何一個實施切割。例如HinfⅠ(流感嗜血杆菌菌株RF)的位點為gantc,所以可以在GAATC,GATTC,GAGTC和GACTC四種位點進行DNA識別和切割。一些常見的,有代表性的限製性核酸內切酶列在表31中。包括來源,識別序列,切割位點和切割後DNA末端形態等信息。所有限製性內切酶的識別順序有一個特征,即具有回文對稱順序,即有一個中心對稱軸,從這個軸沿DNA雙鏈的兩個方向“讀”都完全相同。限製性核酸內切酶的命名原則:第一個字母大寫,表示來源微生物的屬名的第一個字母。第二、三字母小寫,表示來源微生物種名的第一、二個字母。其他字母大寫或小寫,表示來源微生物的菌株編號或質粒名稱。羅馬數字:表示該菌株發現的限製酶的編號。以EcoRⅠ為例:E,Escherichia(屬);co,coli(種);R,RY13(品係);Ⅰ,在此類細菌中發現的順序。

表31限製性內切酶實例

酶的名詞

來源物種

識別序列和切割位點

粘性\/平末端

EcoRⅠ

Escherichia coli

GA↓A┇TTC

5′粘端

PstⅠ

Providencia stuartii

CTG┇CAG↓

3′粘端

BamHⅠ

Bacillus amyloliquefaciens

GG↓A┇TCC

5′粘端

BglⅡ

Bacillus globigii

AG↓A┇TCT

5′粘端

PvuⅠ

Proteus vulgaris

CGA┇TC↓G

3′粘端

PvuⅡ

Proteus vulgaris

CAG┇↓CTG

5′平端

HindⅢ

Haemophilus influenzae Rd

AA↓G┇CTT

5′粘端

HinfⅠ

Haemophilus influenzae Rf

GA↓N┇TC

5′粘端

Sau3A

Staphylococcus aureus

G↓A┇TC

5′粘端

AluⅠ

Arthrobacter luteus

AG┇↓CT

平端

TaqⅠ

Thermus aquaticus

TC↓┇GA

5′粘端

HaeⅢ

Haemophilus aegyptius

GG┇↓CC

平端

NotⅠ

Nocardia otitidiscaviarum

GCG↓G┇CCGC

5′粘端

SfiⅠ

Streptomyces fimbriatus

GGCCNNN┇NN↓GGCC

3′粘端

┇表示對稱軸,↓表示切割位點

3. 限製性內切酶的切割方式:粘性末端和平末端

限製性內切酶的切割方式有兩種,即在識別位點回文序列對稱軸的位點進行切割或在對稱軸兩側兩個或四個堿基位點處進行對稱交錯切割,兩種不同的切割方式分別得到平末端或粘性末端兩種切割產物。PvuⅡ和AluⅠ酶是平末端切割酶的兩個例子。粘性末端是指在限製酶切割後在雙鏈DNA的5′或3′端出現短的單鏈突出序列,因為可以和被切開的另一個DNA分子的5′或3′端短單鏈突出序列重新互補配對,所以稱為粘性末端。根據酶切割方式的不同,可分為兩種,即5′和3′端粘性末端。如EcoRⅠ的酶切產物為5′端突出粘性末端;PstⅠ的酶切產物為3′端突出粘性末端(圖350)。

同裂酶(isoschizomers)指來源不同但識別相同靶序列的核酸內切酶。同裂酶進行同樣的切割,產生同樣的末端。但有些同裂酶對甲基化位點的敏感性不同。例如,限製酶HpaⅡ和MspⅠ是一對同裂酶(CCGG),當靶序列中有一個5甲基胞嘧啶時HpaⅡ不能進行切割,而MspⅠ可以。

同尾酶(isocaudamer)指來源不同、識別靶序列不同但產生相同的粘性末端的核酸內切酶。利用同尾酶可使切割位點的選擇餘地更大。由一對同尾酶分別產生的粘性末端共價結合形成的位點稱為雜種位點(hybrid site),一般不能被原來的任何一種同尾酶識別,如BamHⅠ和BglⅡ兩同尾酶的粘性末端連接後,不會再被BamHⅠ和BglⅡ所識別,但圖351中Sau3A例外,分別和BamHⅠ和BglⅡ的粘性末端形成雜合位點後,均可以被Sau3A所識別並切割。

5′NNAGC↓TNN3′

3′NNTCG↑ANN5′

Alu Ⅰ

5′NNAGCTNN3′

3′NNTCGANN5′平末端

5′NNGA↓ATTCNN3′

3′NNCTTAAG↑NN5′

EcoR Ⅰ

5′NNGAATTCNN3′

3′NNCTTAAGNN5′5′粘性末端

5′NNCTGCAG↓NN3′

3′NNGA↑CGTCNN5′

PstⅠ

5′NNCTGCAGNN3′

3′NNGACGTCNN5′3′粘性末端

圖350不同限製性內切酶切割後產生平末端或5′\/3′端粘性末端

Bam H Ⅰ5′NNGGATCCNN3′

3′NNCCTAGGNN5′

Bgl Ⅱ

5′NNAGATCTNN3′

3′NNTCTAGANN5′

Sau3A

5′NNNGATCNNN3′

3′NNNCTAGNNN5′

圖351一組同尾酶

4. 限製性內切酶的切割頻率

已知長度的DNA分子中特定限製性內切酶的識別序列位點數目可以用數學方法計算。一個堿基四聚體序列(例如,GATC)應每隔44,即256個核苷酸出現一次,一個堿基六聚體序列(例如,GGATCC)每46,即4096個核苷酸出現一次。這些計算是在假定四個核苷酸以相等的比例存在(即GC含量等於50%)且隨機排列的基礎上。實際上,兩個假設都不成立。以λDNA分子為例,基因組長度為49kb,按照理論計算,應該含有一種六堿基限製性核酸內切酶的12位點。事實上,這些識別位點發生頻率大多是較低的。例如,λDNA分子中含有六個BglⅡ位點,五個BamHⅠ位點,隻有兩個SalⅠ位點。這一事實是λDNA分子GC含量小於50%的反映。此外,限製位點通常沿DNA分子不均勻分布(圖352)。如果是均勻分布的情況,那麼用特定的限製性內切酶消化就會產生出大小大致相同的DNA片段。但圖352中顯示的分別用BglⅡ、BamHⅠ和SalⅠ對λDNA進行酶切,產生的片段大小均有較大的差異。這一結果表明λDNA分子中的核苷酸不是隨機均勻分布的。所以,在基因工程克隆實驗中,必須首先對基因序列的限製性內切酶的酶切位點的多少和位置進行分析,即限製性內切酶酶切圖譜分析,在DNA分子序列已知的情況下,可用軟件進行分析,常用分析軟件有DNAMAN和LASERGENE等。

圖352限製性內切酶的切割頻率和位點分布的實例

5. 在實驗室中進行限製性內切酶消化

下文中以BglⅡ消化λDNA(濃度125μg\/mL)樣品為例,對實驗室中DNA酶切消化的方法進行講述。首先,將適量的DNA用精確的微量加樣器移進試管,DNA量的多少根據實驗需要進行添加。比如需要消化16μL,2μg的λDNA樣品。酶切消化體係的其他主要成分為限製性內切酶,一般為從生產廠家及供應商購得的已知濃度限製性內切酶溶液。因為酶需要在低溫-20℃存放才能保持活性,酶一般溶解在含有50%甘油的溶液中,高濃度甘油的存在可以防止反複凍融導致的酶活力的降低。另外,酶儲存液中還含有維持特定pH值的緩衝體係、一定濃度鹽離子以及DTT和BSA等酶活性保護試劑。參見表32中的酶存儲液組分。

表32限製性內切酶酶儲存液組分

成分

濃度

TrisHCl,pH7.5

10mmol\/L

KCl

400mmol\/L

EDTA

0.1mmol\/L

DTT

1mmol\/L

Triton X100

0.15%

BSA

0.01%

Glycerol

50

在酶添加前,含有DNA的溶液必須進行調整以提供正確的酶切條件,以保證酶的最大活性。首先是最適的pH值,大多數限製性內切酶最適pH值為7.4。其次是鹽離子濃度,不同的酶對離子濃度高低的要求不同,不正確的氯化鈉或鎂離子濃度不僅會降低限製性內切酶的活性,也可能導致酶的特異性發生改變,可能在非標準的DNA序列位點上進行DNA的降解。鹽離子濃度通常由鈉和鎂離子提供(Mg2+為所有的Ⅱ型限製性內切酶發揮功能所必需)。另外還應添加還原劑,如二硫蘇糖醇(DTT),使酶穩定並防止其失活。表33中根據鹽離子濃度高低和種類不同分成五種酶切緩衝液體係,不同的限製性內切酶對應各自最適的酶切緩衝液體係。酶切緩衝液母液濃度十倍於工作液濃度,加入反應混合物中而被稀釋。如果反應混合物的最終體積為20μL,那麼酶切緩衝液應添加2μL。

表33限製性內切酶酶切緩衝體係

酶切緩衝液母液

組分及濃度

10X L

100mmol\/L TrisHCl,pH7.5

100mmol\/L MgCl2

10mmol\/L DTT

10X M

100mmol\/L TrisHCl,pH7.5

100mmol\/L MgCl2

10mmol\/L DTT

500mmol\/L NaCl

10X H

500mmol\/L TrisHCl,pH7.5

100mmol\/L MgCl2

10mmol\/L DTT

1000mmol\/L NaCl

10X K

200mmol\/L TrisHCl,pH7.5

100mmol\/L MgCl2

10mmol\/L DTT

500mmol\/LKCl

10X T

330mmol\/L TrisAc,pH7.5

100mmol\/L MgAc

10mmol\/L DTT

660mmol\/L KAc

最後添加限製性內切酶。按照慣例,酶的1單位定義為需要在1h內消化1μg DNA所需的量,所以消化2μg的λDNA需要2單位的酶。BglⅡ酶儲液的常規濃度為4U\/μL,因此,添加0.5μL足以切割DNA。反應混合物中的最終體積為20μL,需要另外添加1.5μL水補足體積。一般的反應體係如表34。

表34酶切體係

組分

量\/體積(總20μL)

DNA

16μL(2μg)

10X H緩衝液

2μL

BglⅡ酶儲液

0.5μL

H2O

1.5μL

最後考慮的因素是酶切孵育溫度。大多數限製性內切酶,如BglⅡ的最適溫度為 37℃,BamHⅠ的最適溫度為30℃。但是例如TaqⅠ,是從水生棲熱菌中分離的一種限製酶,如Taq DNA聚合酶一樣有很高的工作溫度。限製性消化必須在65℃時才能獲得最大酶活性,一般1小時就可完成酶切反應。如果酶切後的DNA片段要用於後續的克隆實驗,必須使酶失活,以避免其意外消化後期添加的其他DNA分子。有幾種使酶失活的方法,大多情況下,70℃條件下的短期孵育足夠滅活酶的活性,也可進行苯酚抽提或通過添加EDTA螯合鎂離子來抑製限製性內切酶的活性。

在酶切過程中,由於反應條件的不適合,經常會出現星號活性(star activity),也稱星活性。星活性的定義為同一類限製性內切酶在某些反應條件變化時酶的專一性發生改變,能在識別位點之外切割DNA分子。例如酶濃度過高(>100U\/μg)、甘油濃度過高(>5% V\/V)、反應液離子強度過低(pH8.0)、反應液中Mg2+被其他陽離子如Mn2+、Zn2+代替或有機溶劑影響時等,酶切割位點專一性發生改變。以上因素的影響程度因酶的不同而有所不同。例如EcoR Ⅰ比PstⅠ對甘油濃度更敏感,而後者則對高pH值更敏感一些。所以在酶切體係中,應盡量用較少的酶進行完全消化反應。這樣可以避免過度消化以及過高的甘油濃度,盡量避免有機溶劑(如製備DNA時引入的乙醇)的汙染,使用廠家推薦的酶反應的緩衝體係,保證最佳的鹽離子濃度和pH。現在也有公司發展了快切反應體係(QuickCut),所有快切限製性內切酶都可應用快切緩衝液在5~30min內有效切斷各種類型DNA,多種酶可在一個反應管中完成酶切反應。

6. DNA分子的限製性酶切圖譜分析

前文中提到過,在DNA分子序列已知的情況下,可以利用軟件進行限製性內切酶圖譜的分析,在目前的全基因組測序的時代,這是一種主流的分析方法。限製性酶切圖譜分析可以保證基因克隆操作過程中選用適合的限製性內切酶。但在基因序列未知的情況下,進行DNA分子的限製性酶切圖譜分析就要通過一係列的酶切反應及電泳分析來實現。例如,要獲得λ噬菌體DNA中XbaⅠ、KpnⅠ和XhoⅠ酶切位點,需要進行下麵一係列的酶切和電泳分析。首先,分別進行三種酶的單酶切分析,電泳後和Marker進行比對,分析各種單酶切產物的片段數目和大小。其次,三種酶分別兩兩組合進行雙酶切分析。雙酶切中,如果兩種酶的反應條件一致,可以同時進行酶切反應,如果反應條件不一致,則需要按次序先後進行。比較單、雙酶切的結果,就可以獲得大多數基因片段的限製性內切酶圖譜。一些酶切位點定位中的問題可以通過部分酶切來解決。部分酶切即DNA分子上隻有限定數量的酶切位點被消化。部分酶切通常通過縮短酶切孵育時間或降低酶切溫度來實現(例如在4℃孵育)。部分酶切的電泳後條帶比較複雜,會出現由於不完全酶切而得到的額外片段。這些片段包含被一個未被切割的位點分開的兩個相鄰的限製性片段。它們的大小將指示完全酶切中的哪兩個限製片段彼此相鄰。通過以上係列分析,就可以獲得一段基因序列的限製性內切酶圖譜。

表35是λDNA XbaⅠ、KpnⅠ和XhoⅠ的酶切結果分析,從表格35中,可以得知λDNA中XbaⅠ、KpnⅠ和XhoⅠ的酶切位點個數分別是1、1和2個,可以首先獲得 XbaⅠ和XhoⅠ的酶切圖譜(圖353a),KpnⅠ的兩個切點均在24kb長的片段內,需要進行部分酶切鑒別。從部分酶切結果來看,48.5kb為全長λDNA,1.5kb,17kb,30kb為KpnⅠ完全酶切片段,18.5kb和31.5kb為KpnⅠ部分酶切片段,推測KpnⅠ的圖譜為圖353b,確定XbaⅠ,XhoⅠ,KpnⅠ的圖譜為圖353c。

表35λDNA酶切結果

酶切後片段數目

酶切後片段大小(kb)

XbaⅠ

2

24.0,24.5

XhoⅠ

2

15.0,33.5

KpnⅠ

3

1.5,17,30

XbaⅠ+XhoⅠ

3

9.0,15.0,24.5

XbaⅠ+KpnⅠ

4

1.5,6.0,17.0,24.0

KpnⅠ部分酶切

6

1.5,17.0,18.5,30.0,31.5,48.5

圖353λ噬菌體DNA中XbaⅠ、KpnⅠ和XhoⅠ限製性酶切圖譜分析

3.2.2連接酶

DNA連接酶是生物體內重要的酶,其催化的反應在DNA的複製和修複過程中起著重要的作用。在細胞內,DNA連接酶的作用是修複出現在雙鏈DNA分子中的單鏈斷裂(discontinuities,即兩個核苷酸之間的磷酸二酯鍵缺失而不是缺少一個或多個核苷酸)。大多數生物的DNA連接酶可以將兩個獨立的雙鏈DNA片段連接在一起的。DNA連接酶分為兩大類:一類是利用ATP的能量催化兩個核苷酸鏈之間形成磷酸二酯鍵的DNA連接酶;另一類是利用煙酰胺腺嘌呤二核苷酸(NAD+)的能量催化兩個核苷酸鏈之間形成磷酸二酯鍵的DNA連接酶。

基因工程中常用的DNA連接酶有兩類,即來自大腸杆菌的DNA連接酶和來自T4噬菌體的T4 DNA連接酶。DNA連接酶特點是能夠將DNA鏈上彼此相鄰的3′羥基(OH)和5′磷酸基團(P),在NAD+或ATP供能的作用下,形成磷酸二酯鍵。DNA連接酶和T4 DNA連接酶分別使用NAD+和ATP作為輔助因子。DNA連接酶隻能連接缺口(nick,即相鄰兩個核苷酸隻有磷酸二酯鍵的斷裂),不能連接裂口(gap,即缺少一個或多個核苷酸)。而且被連接的DNA鏈必須是雙螺旋DNA分子的一部分,即不能連接單鏈DNA分子(圖354)。

5′GGACTTCACT3′

3′CCTGAAGTGA5′

DNA連接酶

5′GGACTTCACT3′

3′CCTGAAGTGA5′

5′GGACTTCACT3′

3′CCTGAAGTGA5′

DNA連接酶

5′GGACTTCACT3′

3′CCTGAAGTGA5′

5′GGACTCACT3′

3′CCTGAAGTGA5′

5′GGACTCACT3′

3′CCTGAAGTGA5′

5′GGACATCACT3′

5′GGACATCACT3′

圖354DNA連接酶的DNA底物類型

3.2.3聚合酶

聚合酶是一種以DNA或RNA為模板,從5′到3′方向合成DNA互補鏈的酶。大多數DNA聚合酶都需要有引物來起始DNA的合成,在引物的3′—OH末端逐個添加核苷酸。基因工程中經常使用四種類型的DNA聚合酶:第一個是DNA聚合酶Ⅰ,通常由大腸杆菌製備。這種酶附著在主要是雙鏈結構的DNA分子的短的單鏈區域(或缺口)處,合成一條全新的鏈,並在其聚合過程中降解原有的鏈(圖355)。因此,DNA聚合酶Ⅰ是雙功能酶的一個例子,具有DNA聚合酶和DNA核酸酶兩種活性。DNA聚合酶Ⅰ的聚合酶和核酸酶活性受酶分子不同部分的控製。酶分子前323個氨基酸的多肽有核酸酶活性,所以去除這個片段後留下一個保留聚合酶功能,但不能降解DNA的酶,稱為Klenow酶。Klenow酶也以單鏈DNA為模板,催化合成一個互補的DNA鏈,但是由於不具有核酸外切酶活性,所以當單鏈缺口被填滿後,合成就終止了,不會發生鏈的取代(圖355)。

其他幾種酶聚合酶自然和修改後的版本和Klenow片段具有相似的性質。在早些年的DNA測序中發揮過重要的作用,盡管它們在DNA標記中仍然有重要的應用,但現在已經在很大程度上被取代了。第三類聚合酶為實驗室常用的耐熱DNA聚合酶。Taq DNA聚合酶由一種生活在熱泉中的水生耐熱菌株Thermus aquaticus中分離提取出來的。Taq的許多酶,包括Taq DNA聚合酶均具有耐熱性,這意味著它們在高溫下不會變性。Taq DNA聚合酶這一特點使它適合於PCR反應,可以避免反應溫度提高到94℃進行DNA變性時被滅活。Taq DNA聚合酶具有5′3′外切酶活性,但不具有3′5′外切酶活性,因而在合成中對某些單核苷酸錯配沒有校正功能。

Taq DNA聚合酶還具有非模板依賴性活性,可將PCR雙鏈產物的每一條鏈3′加上單核苷酸尾,故可產生具有3′尾部單A核苷酸突出的PCR產物。應用這一特性,可通過TA克隆策略進行PCR產物的克隆。耐熱DNA聚合酶多應用在PCR技術中。

各種耐熱DNA聚合酶均具有5′3′聚合酶活性,但不一定具有3′5′和5′3′的外切

5′GA|引物A3′

3′CTTAACATGA5′ DNA模板

DNA聚合酶

5′GAATTGTACT新合成的鏈3′

3′CTTAACATGA5′

5′GAA缺口TACT3′

3′CTTAACATGA5′

DNA聚合酶Ⅰ

5′GAATTGTACT原來的DNA鏈被取代3′

3′CTTAACATGA5′

5′GAATACT3′

3′CTTAACATGA5′

Klenow酶

5′GAATTGTACT3′

3′CTTAACATGA5′

5′GAA3′

3′CUUAACAUGA5′ RNA模板

逆轉錄酶

5′GAATTGTACT3′

3′CUUAACAUGA5′

5′

——AGAATTGTAC3′

3′——|SP6\/T7啟動子TCTTAACATG5′ 模板鏈

SP6\/T7

RNA聚合酶

5′AGAAUUGUAC3′ RNA產物

圖355聚合酶的催化方式

酶活性。3′5′外切酶活性可以消除錯配,切平末端;5′3′外切酶活性可以消除合成障

礙。除上述Taq DNA聚合酶外,還有一類具備3′5′外切酶活性的高保真耐熱DNA聚合酶,如pfu DNA聚合酶和Vent DNA聚合酶,分別從Pyrococcus furiosis和Litoralis棲熱球菌中分離和精製而成,它們不具有5′3′外切酶活性,但具有3′5′外切酶活性,可校正PCR擴增過程中產生的錯誤,獲得產物的堿基錯配率極低。PCR產物為平端,3′端無突出的單A核苷酸。

第四類為依賴於DNA的RNA聚合酶(DNA dependent RNA polymerase)。依賴於DNA的RNA聚合酶包括SP6噬菌體RNA聚合酶(來源於感染鼠傷寒沙門氏菌LT2菌株)和T4或T7噬菌體RNA聚合酶(來源於噬菌體感染的大腸杆菌)。這些RNA聚合酶實際上為轉錄中的RNA合成酶,識別DNA中各自特異的啟動子序列,並沿此dsDNA模板起始RNA的合成。它與DNA聚合酶不同,無須引物,但需識別特異性位點。SP6和T7RNA聚合酶的用途主要用於體外合成RNA分子或表達外源基因(圖355)。

第五類為逆轉錄酶,逆轉錄(reverse transcription)是以RNA為模板合成DNA的過程,即催化RNA指導下的DNA合成(圖355)。此過程中,核酸合成與轉錄(RNA到DNA)過程與遺傳信息的流動方向(DNA到RNA)相反,故稱為逆轉錄。逆轉錄過程是RNA病毒的複製形式之一,需逆轉錄酶的催化。逆轉錄過程的揭示是分子生物學研究中的重大發現,是對中心法則的重要修正和補充。人們通過體外模擬該過程,以樣本中提取的mRNA為模板,在逆轉錄酶的作用下,合成出互補的cDNA,構建cDNA文庫,並從中篩選特異的目的基因。該方法已成為基因工程技術中最常用的獲得目的基因的策略之一。反轉錄酶都具有多種酶活性,主要包括以下幾種活性。

① DNA聚合酶活性。以RNA為模板,催化dNTP聚合成DNA的過程。反轉錄酶中不具有3′→5′外切酶活性,因此沒有校正功能,所以由反轉錄酶催化合成的DNA出錯率比較高。

② RNase H活性。由反轉錄酶催化合成的cDNA與模板RNA形成的雜交分子,將由RNase H從RNA5′端水解掉RNA分子。

③ DNA指導的DNA聚合酶活性。以反轉錄合成的第一條DNA單鏈為模板,以dNTP為底物,再合成第二條DNA分子。反轉錄酶的應用已在第1章RTPCR章節中有介紹。

3.2.4DNA修飾酶

許多DNA工具酶通過添加或除去特定化學基團而改變DNA分子。最重要的DNA修飾酶如下:

1. 堿性磷酸酶(alkaline phosphatase)

分子克隆中使用的磷酸酶主要來源於牛小腸堿性磷酸酶(Calf intestinal alkaline phosphatase),簡稱CIP或CIAP,也有來自細菌的堿性磷酸酶(Bacterial alkaline phosphatase, BAP)和蝦的堿性磷酸酶(Shrimp alkaline phosphatase, SAP )。它們均能催化除去DNA或RNA 5′磷酸的反應(圖356)。通過去除5′磷酸基團,可用於防止DNA片段自身連接,或標記(5′端)前去除DNA或RNA 5′磷酸。

2. T4多核苷酸激酶

T4多核苷酸激酶(T4 polynucleotide kinase)是一種磷酸化酶,可將ATP的γ磷酸基轉移至DNA或RNA的5′末端(圖356)。在分子克隆應用中呈現兩種反應:其一是正反應,指將ATP的γ磷酸基團轉移到無磷酸的DNA 5′端,用於對缺乏5′磷酸的DNA進行磷酸化;其二是交換反應,在過量ATP存在的情況下,該激酶可將磷酸化的5′端磷酸轉移給ADP,然後DNA從ATP中γ磷酸而重新磷酸化。在這兩個反應中如果使用的ATP均為放射性同位素32P標記,那麼反應的產物都變成末端獲得放射性標記的DNA。

3. 末端轉移酶

末端轉移酶(terminal deoxynucleotidyl transferase,TdT)是一種無須模板的DNA聚合酶,催化脫氧核苷酸結合到DNA分子的3′羥基端,作用底物可以是DNA單鏈,也可以是DNA雙鏈(圖356)。這種酶的優選底物是3′突出端,但它也可以添加核苷酸至鈍末端(blunt end)或凹陷的3′末端(recessed 3′ end)。末端轉移酶的主要用途包括:(1) 給載體或cDNA加上互補的同聚尾(用於建立體外重組DNA分子時,在DNA片段末端加上一個同聚物尾巴,兩種不同的DNA分子加上不同的但可以互補的,即A和T、C和G的尾巴後,經過退火或複性,兩種尾巴便可以借助互補作用連接在一起)。在早期cDNA文庫建立時,這種加尾方法是使cDNA插入載體中的常用方法之一。(2) 用於DNA片段3′末端的放射性核素標記。末端轉移酶在Mg2+存在的條件下,選擇3′—OH端單鏈DNA為引物加成核苷酸,在Co2+存在的條件下,選擇3′—OH端雙鏈DNA為引物加成核苷酸,形成多聚核苷酸尾。如果在反應係統中加入放射性標記的核苷酸,那麼便可得到3′端標記的DNA分子。該法常用於核酸末端標記和核酸連接的互補多聚尾(連接頭)。

5′○PGAATTGTACTOH3′

3′HOCTTAACATGA○P5′

堿性磷酸酶

5′HOGAATTGTACTOH3′

3′HOCTTAACATGAOH5′

5′HOGAATTGTACTOH3′

3′HOCTTAACATGAOH5′

多核苷酸激酶

5′○PGAATTGTACTOH3′

3′HOCTTAACATGA○P5′

5′GGACTTCACT3′

末端轉移酶

+dCTP

5′GGACTTCACTCCCCC3′

5′GGACTTCACT3′

3′CCTGAAGTGA5′

末端轉移酶

+dCTP

5′GGACTTCACTCCCCC3′

3′CCCCCCCTGAAGTGA5′

圖356DNA修飾酶

3.2.5重組酶在基因工程中的應用

在最近十餘年的基因工程技術發展過程中,在基因克隆即將基因片段和載體重組成重組DNA分子過程中,除了DNA連接酶外,重組酶也得到了廣泛應用。

第一類重組酶是參與細胞體內的位點特異性重組的一類酶。位點特異性重組(sitespecific recombination)是遺傳重組的一類。這類重組依賴於小範圍同源序列的聯會,重組也隻發生在同源的短序列的範圍之內,需要位點特異性的蛋白質分子參與催化,重組的蛋白不是同源重組的Rec蛋白係統而是int、Cre等重組酶,如催化噬菌體λ定點插入到宿主細胞基因組的intergrase。重組時發生精確的切割和DNA鏈的交錯連接反應,DNA不缺失、不添加。位點特異性重組係統有很多種,目前已得到應用的有λInt\/attB係統、P1噬菌體Cre\/loxP係統、釀酒酵母2μm質粒來源的FLPFRT係統、魯酵母pSR1質粒來源的RRS係統以及釀酒酵母線粒體基因內含子編碼的ISceI係統,但是應用最多的還是λInt\/attB係統和Cre\/loxP係統。

λ噬菌體編碼λ整合酶(integrase),這個酶能指導噬菌體DNA插入大腸杆菌染色體中。這種插入作用是通過兩個DNA分子的特異位點進行重組。位點特異重組係統由四個方麵組成:① λ整合酶(Integrase,Int);② 來自E.coli的一種輔助蛋白,稱為整合作用宿主因子(IHF,integration host factor);③ 鎂離子;④ 含有噬菌體和細菌DNA發生重組交叉的特異位點(稱為attP和attB,att源自attachment)的DNA片段。attB由稱為BOB′的序列組成,而attP由POP′組成。O是核心序列,是attB和attP所共同的,而其兩側的序列是B、B′和P、P′,被稱為臂。噬菌體DNA是環狀的,重組時被整合入細菌染色體中,成為線性序列。原噬菌體DNA的兩側是兩個新的雜種att位點,左側稱為attL,由BOP′組成,而右側為attR,由POB′組成。可見,整合和切出並不涉及相同的一對序列,整合需要識別attP和attB,而切出要求識別attL和attR。因此,重組位點的識別就決定了位點專一性重組的方向──整合或切出。整合酶和IHF對整合和切出都是必需的。以此係統發展起來的gateway載體係統已得到廣泛的應用。

gateway載體係統一般含有三類載體,即供體載體(donor vector)、入門載體(entry vector)和目的載體(destination vector)。gateway載體係統中有兩種類型的重組酶混合物。酶的類型分為BP clonase混合酶和LR clonase混合酶。BP clonase酶包含Int(整合)和IHF(整合宿主因子)的蛋白質,催化PCR產物或DNA片段的克隆(含有attB位點)和供體載體(含有attP位點)體外重組產生入門載體。Gateway LR酶Ⅱ酶混合物含有Int(整合)、IHF(整合宿主因子)和Xis(切除酶)酶,催化一個入門克隆重組體之間(兩側含attL位點的感興趣的基因)和目的載體(含attR位點)來產生表達載體克隆和其他目標載體。得到入門載體後,可以通過LR反應將目的基因克隆進各種目標載體,大大提高了載體的構建效率(圖357)。

圖357Gateway載體中的BP反應和LR反應

大腸杆菌P1噬菌體Cre基因編碼的38.5kDa產物的重組酶(recombinase),能識別並催化loxP位點間的重組。loxP位點含34bp,包括被8bp間隔的兩個13bp反向重複,每個反向重複及其臨近的4bp構成一個Cre蛋白的結合區。鏈間的交換可發生在間隔區的6bp之間,一旦Cre重組酶介導的DNA剪切作用發生便產生一個突出的5′末端。該間隔區是非對稱性的,這種非對稱性決定了loxP位點具有方向性,從而最終決定了重組的拓撲學結果:非連鎖分子間的重組能夠形成共整合分子。同一分子內同向的兩個loxP位點間的DNA會由於重組的發生而被切除,而反向重複LoxP位點間的重組則導致DNA倒位。在基因組中loxP序列自然發生的概率極低,其他相關序列引起的重組活性可以忽略不計。因此在應用該係統時就需要首先向目的係統中引入loxP序列,然後通過一定的途徑激活Cre重組酶的活性,以實現在loxP位點的特異整合或重組。基於這一原理,Cre\/loxP係統已在發育生物學、遺傳學、基因工程及分子生物學領域得到了有效的利用,詳細使用實例可參照基因功能研究方法中條件型基因敲除部分。

另外,利用末端同源重組技術進行一步法克隆的技術在最近幾年廣泛流行。多個公司開發了相似的一步法克隆試劑盒。利用重組酶,可以將任意線性化載體和具有與其兩端20bp左右同源序列的DNA片段間實現快速定向克隆(圖358)。這裏用到的重組酶來自大腸杆菌Rec同源重組係統,有些公司產品為重組酶複合物,如其公司的專利申請書中寫明重組酶複合物包含RecE、RecT和Gamma蛋白,三種重組酶的含量比例為1∶1∶2。 它的產品優勢在於:(1) 無須考慮酶切位點:不受插入片段酶切位點的限製,適用於任何載體,插入片段兼容粘性或平末端;(2) 設計簡單:在插入片段的PCR擴增引物5′端引入20bp左右與載體末端同源的序列,進行PCR擴增既可;(3) 快速高效:50℃,20min 即可完成重組反應。克隆陽性率可達95%以上;(4) 應用廣泛:可用於單片段或多片段定向克隆,也可結合高保真酶,應用於定點突變。

圖358大腸杆菌Rec同源重組係統在基因同源重組克隆中的應用

特配電子資源

線上資源

微信掃碼

 網絡習題

 視頻學習

 延伸閱讀

第4章目的基因的獲取

第4章目的基因的獲取

在基因工程的研究過程中,第一步即為目的基因的獲取,就是獲得基因的序列信息,在第1章的講述中,我們介紹了PCR技術,在基因序列已知的情況下,通過設計特異引物,進行PCR擴增就可獲得目的基因。在基因的cDNA序列獲取過程中,在已知基因的部分序列時可以通過5′RACE和3′RACE技術獲得基因的全長cDNA序列,這樣才能為後續的基因克隆、基因功能分析奠定基礎。所以獲得基因的序列信息是進行PCR擴增、基因克隆和後續基因功能研究的基礎。根據預先所知信息的不同,可以采用不同的策略來獲得目的基因序列,下麵介紹一些常用的方法。

4.1從數據庫中搜尋目的基因序列

隨著測序物種的增多,許多基因序列都保存在相應的數據庫中,需要從數據庫中進行搜索、查詢以及比對等分析,獲得相應的目的基因序列信息。常用的綜合數據庫有美國國家生物技術信息中心(National Center for Biotechnology Information)創建的數據庫,網址為https:\/\/www.ncbi.nlm.nih.gov\/。還有一些物種專用的數據庫,主要是一些模式生物的數據庫,如擬南芥的數據庫TAIR(http:\/\/www.arabidopsis.org),玉米的數據庫MaizeGDB(https:\/\/www.maizegdb.org\/),線蟲數據庫WormBase(http:\/\/www.wormbase.org\/#012345)和果蠅數據庫(http:\/\/flybase.org\/)等。在主頁搜索欄選擇搜索內容,搜索框中填入基因號或蛋白序列號,就可找到相應的基因序列。以擬南芥基因查詢為例,在已知基因號At3g11280的條件下,在TAIR網站的首頁選擇搜索基因欄中填入At3g11280進行搜索,所得搜索頁麵中含有基因序列信息,基因功能注釋和基因突變體等信息。點擊相關鏈接就可以獲得相應的基因組序列、cDNA序列和蛋白質序列。

利用數據庫進行序列信息查詢還有另一種情況,即在已知模式種基因序列的前提下,擬獲得另一物種中的同源基因序列,這時需要進行Blast分析,在NCBI Blast界麵輸入已知基因的核苷酸序列或蛋白質序列,選擇相應的生物基因組文庫,進行檢索獲得相應的基因序列。在許多物種已完成測序的後基因組時代,大多數所研究的目的基因都屬於已測序的物種,所以上述從數據庫中查詢相應基因序列的方法也成為基因獲得的主要手段。

4.2從基因文庫中搜尋目的基因序列

在基因工程和分子生物學研究的早期,即人類基因組計劃之前的時期,大多物種的測序沒有完成,缺乏目前各物種完備的數據庫序列信息,想要獲得某個生命體基因組特定的基因序列,均需要從這種生物的基因文庫中獲取。

4.2.1基因文庫的定義

基因文庫(gene library)是指一組插入到特定載體的重組DNA克隆的集合體,含有一個物種的全部基因序列。即將含有某種生物不同基因序列片段的載體集合——外源基因重組DNA片段集合,導入受體菌的群體中擴增,每個受體菌克隆分別含有這種生物的不同的基因片段。可分為基因組文庫(genomic library)和cDNA文庫(cDNA library)。基因組文庫是指含有一個物種全部基因組DNA序列的重組DNA克隆的集合體。一種生物的基因組文庫隻有一種,因為不同的細胞類型基本含有相同的基因組DNA序列。比如說大腸杆菌的基因組文庫就包含大腸杆菌全部基因組DNA序列,相關基因可以從文庫中獲得進行研究,文庫可以保存很多年並能進行繁殖。cDNA文庫指含有從一定生長發育階段或環境條件下的某種組織細胞分離到的全部mRNA經反轉錄成cDNA的重組DNA克隆的集合體。理論上,一個物種,特別是高等動物和植物的cDNA文庫可以有無數種。因為高等動植物有高度分化的組織器官和細胞,有不同的發育階段,受到不同的環境條件影響等,不同來源細胞、不同發育階段和環境條件下的細胞轉錄組均不相同,由此構建來的cDNA文庫也將不同。所以cDNA文庫有下列特點:(1) 基因特異性。常來自結構基因,僅代表某種生物的一小部分正在表達的基因的遺傳信息;(2) 器官特異性。不同器官或組織的功能不一樣,因而有的結構基因的表達就具有器官特異性,故由不同器官提取的mRNA所組建的cDNA文庫也就不同;(3) 代謝或發育特異性。處於不同代謝階段(或發育階段)的結構基因表達亦不相同;(4) 不均勻性。在同一個cDNA文庫中,不同類型的cDNA分子的數目是大不相同的。這是因為不同基因的轉錄水平高低差異很大,獲得mRNA產物的豐度也會有很大差異。這與基因組文庫中的單拷貝基因均具有相同的克隆數相比,是兩種文庫的另一差別。

4.2.2基因文庫的構建

構建基因組文庫所需的載體通常為較大容量的載體,包括λ噬菌體載體,Cos質粒(粘粒)和人工染色體載體,如PAC、BAC和YAC等。構建cDNA文庫的常用載體為一些具有表達功能的質粒載體,如可以在酵母細胞中進行表達的載體。

基因組文庫的構建有以下一係列的流程:首先是載體和基因組DNA片段的製備。對於載體的製備,包括載體DNA分子的純化,特定限製性內切酶的酶切消化和用堿性磷酸酶去除5′磷酸基團,防止載體的自連。基因組DNA製備的目的是獲得特定大小的基因組DNA片段,考慮到不同生物基因組的大小不同,其基因組DNA片段的大小有很大差異,對於基因組較小的單細胞原核和真核生物,製備後的基因組DNA的大小在20kb左右,利用λ噬菌體載體或Cos質粒載體構建文庫。但對於高等動植物,如人的基因組來說,需要製備約100kb以上的基因組DNA大片段,需要用人工染色體載體構建基因組文庫。基因組DNA特定大小片段的獲得可以通過限製性內切酶的不完全酶切,並用脈衝場電泳分離目標大小的基因組DNA片段。文庫構建的第二步是將載體和基因組DNA片段進行連接,要提高重組頻率,應注意連接反應體係中的總DNA濃度和兩種DNA分子的摩爾比。在PAC文庫構建的連接體係中,大於150kb片段和19kb載體pCYPAC的摩爾比是10∶1,50μL連接體係中的兩種DNA含量為20ng~50ng,T4連接酶200U~400U,16℃連接8h~24h。文庫構建的第三步是利用轉化或感染方法將連接的重組DNA分子導入宿主細胞,讓其自主複製,重組DNA分子被擴增。為了提高轉化效率,可以選用製備超級感受態細胞的方法,提高宿主細胞接受外源DNA的能力,也可嚐試不同的轉化方法,如利用電擊儀進行的電擊轉化,可以大大提高人工染色體如PAC構建的重組DNA大片段分子的轉化率。

文庫構建完成後,要對文庫的質量進行檢測,確定基因組文庫是否覆蓋了某種生物的全部基因組DNA序列。需要檢測三個指標:第一個是重組率,即所有轉化子中攜帶基因組DNA的重組克隆的出現概率,重組頻率越高,質量越高,可大大減輕後續篩選基因工作量。如文獻報道利用pCYPAC載體構建人基因組文庫時的重組率是97%。第二個指標是重組克隆中插入片段的平均大小。要判定基因組文庫中插入片段的平均大小,需要從文庫中隨機挑選20個以上的克隆,進行重組DNA的提取及酶切後的電泳鑒定。第三個指標為構建某一基因組文庫所需的最小克隆數。最小克隆數與物種本身的基因組大小相關,也與每個克隆中的所插入的基因組DNA片段大小相關。下麵的公式可以進行最小克隆數的計算:

N=ln(1-P)ln1-ab

式中:N為基因組文庫中的克隆數;P為某一基因序列在文庫中的出現概率,一般設為95%;a為文庫中重組克隆中插入片段的平均大小;b為某一生物的基因組大小。通過計算,表41中列出各種生物在分別以λ噬菌體載體(容量為17kb),Cos質粒(粘粒,容量為35kb)為載體時所需要的基因組文庫中的最小克隆數。

從表41中可以看出,利用λ噬菌體載體和Cos載體構建水稻、人和青蛙基因組文庫時,所需要克隆數要達到數十萬甚至上百萬,這很難實現,所以這類高等生物的文庫構建需要借助BAC、PAC和YAC等能夠達到100kb克隆容量的載體。基因組文庫的構建流程可以參照圖346酵母人工染色體pYAC4的克隆策略。

表41構建不同物種基因組文庫所需的最小克隆數

物種基因組大小(bp)

最少克隆數目(個)a

17kb片段b35kb片段c

大腸杆菌

4.6×106

820

410

釀酒酵母

1.8×107

3225

1500

果蠅

1.2×108

21500

10000

水稻

5.7×108

100000

49000

3.2×109

564000

274000

青蛙

2.3×1010

4053000

1969000

a:特定基因在文庫中出現概率為95%時所需克隆數;

b:適合λ替換型載體λDAHⅡ的基因片段;

c:適合柯斯質粒的基因片段。

cDNA文庫的構建一般有以下流程:(1) 載體DNA片段的製備,製備方法同基因組文庫構建,一般用於構建cDNA文庫載體分子量較小,多為質粒載體和噬菌體載體;(2) 多聚(A)mRNA的分離與純化,從特定組織和細胞樣品中抽提總RNA,並進行mRNA分子純化或直接分離mRNA分子;(3) 雙鏈cDNA的合成,以oligod(T)為引物進行反轉錄合成cDNA第一條鏈,而後用RNaseH降解雜合雙鏈中的RNA鏈,再用DNA聚合酶Ⅰ置換合成法合成cDNA第二條鏈(圖41a);(4) dscDNA與載體DNA相連,連接的策略有① 人工接頭:可實現cDNA的定向插入,要求具平端dscDNA,但酶切時可能導致某些cDNA鏈斷裂(圖41b);② 同聚物加尾:可大大減少載體DNA自身連接;③ 可以參照5′RACE中CLONTECH的SMARTTM RACE方法進行克隆;(5) 重組cDNA分子的轉移到宿主細胞和文庫的建立,選用載體為質粒,可直接轉化大腸杆菌。若為λ載體,則需進行體外包裝、感染等。cDNA文庫的質量檢測可參考基因組文庫。

cDNA文庫中有一類常用的酵母雙雜交文庫,酵母雙雜交是一種鑒定蛋白間相互作用的方法,在第7章中有介紹。酵母雙雜交文庫構建時選用的載體為酵母表達載體如pGADT7(圖42),文庫中不同的cDNA片段克隆到GAL4轉錄因子的轉錄激活域(Activating Domain)的編碼序列之後,構成由AD結構域和不同蛋白融合形成的獵物蛋白集合。

圖41cDNA文庫的構建

a. 雙鏈cDNA的獲取;b. cDNA定向插入載體

圖42酵母雙雜交獵物載體pGADT7

4.2.3從文庫中篩選目的基因

下一個要解決的問題為如何從文庫中篩選目的基因?可以通過兩種途徑進行:第一依賴於對目的基因的DNA序列的識別,第二依賴於對目的基因的蛋白產物的識別。

1. 通過菌落或噬菌斑原位雜交的方法鑒定含有目的基因的克隆

兩個不同來源的具有完全互補或部分互補序列的單鏈DNA分子之間能通過堿基互補配對形成一個雜合雙鏈DNA分子,這一過程稱為分子雜交。利用這一原理發展了分子雜交技術,我們在第2章中已有詳細介紹。菌落或噬菌斑原位雜交技術為分子雜交技術的一種特殊形式,其本質也在於通過標記的探針鑒定含有特定基因重組DNA分子的細菌菌落或噬菌斑(圖263)。

菌落原位雜交的具體技術路線可參照圖263。首先,將菌落或噬菌斑轉移到硝酸纖維素或尼龍膜上,然後裂解細胞並去除汙染物質,隻留下DNA分子。通常,處理過程也會導致DNA分子變性,雙螺旋鏈間的氫鍵斷裂,形成單鏈分子。這些單鏈DNA分子可以通過80℃加熱在短時間內與硝酸纖維素膜緊密結合,如果使用尼龍膜,紫外線照射可以讓單鏈DNA和膜牢固接合。隨後,經過標記並變性成單鏈的探針分子在特定雜交溶液中與膜上接合的目標基因單鏈DNA分子發生雜交,洗去未接合的探針後,通過不同的方法檢測雜交信號,確定含有目標基因序列的菌落或噬菌斑。

整個實驗過程的重要基礎是獲得可利用的探針分子。探針分子的特征是其全部或部分序列必須與待分離的目的基因互補。但這又存在著一個悖論,即待分離的目的基因序列本身就是未知的,又怎麼能獲得探針分子序列呢?在實際應用中,探針序列信息的獲得是建立在待分離基因的相關信息基礎上的。下麵將以以下三種情況為例講述利用菌落或噬菌斑原位雜交鑒定目的基因的原理和方法。

(1) 已知待分離的目的基因在某個特定的cDNA文庫中重組克隆的拷貝數很高。

這種情況可以用以下方法進行這一基因的分離。例如在小麥未成熟的小麥籽粒cDNA文庫中篩選小麥麥穀蛋白基因,已知小麥麥穀蛋白基因在小麥正在發育的籽粒中表達豐度極高。在這種情況下,從文庫中隨機選擇單一克隆,純化出重組DNA序列並標記作為探針對文庫進行篩選。依次隨機選擇多個克隆來源的探針進行文庫篩選,根據鑒定出的雜交克隆的多少來判定是否為目的基因(圖43)。能夠得到許多雜交信號的探針來源的克隆基本可以確定是待篩選的目的基因克隆。當然,後續還需要對所鑒定的克隆進行測序分析及表達蛋白信息進行確定。

圖43cDNA文庫中高豐度基因的分離方法

(2) 已知待克隆基因所編碼蛋白的全長或部分序列。

在已知待分離目的基因所編碼全長或部分蛋白序列的基礎上,可以由蛋白質的氨基酸序列反向推導出基因的核苷酸序列。值得注意是,除了色氨酸和甲硫氨酸隻對應一個三聯體密碼子之外,其他氨基酸均對應兩個以上的密碼子。所以由氨基酸序列推導出來的核苷酸序列均為兼並序列。以酵母中在呼吸鏈中起重要作用的細胞色素C蛋白序列為例(圖44),選取從59~64的六聚肽為對象合成核苷酸探針,根據密碼子的兼並情況,共可推導出16種核苷酸探針,即TGGGAT\/CGAA\/GAAT\/CAAT\/CATG,在長度為18個堿基的核苷酸序列中,有14個堿基都是確定的,隻有4個堿基不確定。在基因文庫篩選時,合成16種末端標記的18聚核苷酸探針混合物對文庫進行篩選,16種探針中的某一種可能識別目的基因序列並進行雜交,經檢測即可獲得雜交信號。出現雜交信號的克隆即為含有待分離的目的基因。

這一實驗結果通常需要進行更多一輪的雜交驗證,這時需要選取蛋白多肽序列其他區段,推導出作為探針的寡核苷酸序列庫並進行文庫的雜交篩選。在探針合成時,蛋白質區段的選擇至關重要,一般選擇一段含有較少對應密碼子的氨基酸序列,如上述例子中,

GLYSERALALYSLYSGLYALATHRLEUPHELYSTHRARGCYSGLU15

LEUCYSHISTHRVALGLULYSGLYGLYPROHISLYSVALGLYPRO30

ASNLEUHISGLYILEPHEGLYARGHISSERGLYGLNALAGLNGLY45

TYRSERTYRTHRASPALAASNILELYSLYSASNVALLEU

TRPASP60

GLYASNASNMETSERGLUTYRLEUTHRASNPROLYSLYSTYRILE75

PROGLYTHRLYSMETALAPHEGLYGLYLEULYSLYSGLULYSASP90

ARGASNASPLEUILETHRTYRLEULYSLYSALACYSGLU 103

圖44酵母細胞色素C蛋白部分序列

六個氨基酸中兩個氨基酸隻有一個密碼子,另外四個隻有兩個密碼子。這樣才能合成較少種類的寡核苷酸序列並在一定程度上保證探針的特異性。如從下麵的六肽序列SerGluTyrLeuThrAsn可以推導出幾千種核苷酸種類,肯定不適合進行探針的合成。

(3) 已知待克隆基因基因家族中的其他同源基因(paralog)序列或其他物種中的同源基因(Ortholog)序列(異源探針篩選)。

由於生物進化中的保守性,不同物種中的同一種蛋白的基因在基因序列上往往有一定程度的相似性。用一種物種基因來源的探針去篩選另一種物種的基因文庫,即異源探針篩選。探針可以和目標基因間通過堿基互補配對形成雜交分子,雖然在堿基序列上達不到完全的互補配對,但也可以形成穩定的雜交分子,為後續的雜交信號鑒定提供分子基礎。例如,可以用酵母中的細胞色素C基因來源的探針去篩選粗糙鏈孢菌的基因文庫,可以獲得粗糙鏈孢菌的細胞色素C基因序列。

異源探針篩選的另一種應用是已知一基因序列的情況下,篩選同一物種中位於同一基因家族中的其他家族成員的基因序列。以擬南芥中的R2R3MYB轉錄因子家族為例,其成員高達一百多個,在擬南芥的生長發育和生命活動中發揮不同的功能,基因序列有很大的差異。但是不同的家族成員中含有一個高度保守的DNA結合結構域,長約120個氨基酸,以此段氨基酸序列對應的核苷酸序列為探針,可以在文庫篩選出其他多個家族成員基因。

利用探針進行分子雜交的方法是文庫篩選的首選方法,隨著技術的改進,可以在一次雜交篩選中篩選10000個重組DNA克隆,可以在很短時間內完成一個大型文庫的篩選,提高基因鑒定的效率。在某些情況下,探針的不易獲取限製了這種方法的應用。

2. 根據文庫中目的基因的蛋白表達產物鑒定目的基因

在蛋白表達文庫中,每一個含有重組DNA表達載體的宿主菌都可以進行異源蛋白的表達,根據異源蛋白的特性,利用免疫印跡的方法進行文庫的篩選。這一方法的應用基礎是必須要獲得這一蛋白的抗體,通過抗體抗原相互特異識別的特點進行目標基因的篩選。常用的方法為菌落\/噬菌斑原位免疫印跡法。如圖45所示,首先將菌落或噬菌斑原位轉移到聚乙烯醇和硝酸纖維素膜上,裂解細胞,再添加特異性抗體(第一抗體)的溶液進行免疫雜交,一抗抗原(目標基因表達的蛋白)的雜交信號通過添加帶有標記的第二抗體來識別。第二抗體為特異識別一抗的抗體。第二抗體分子一般通過偶聯生色酶(AP,堿性磷酸酶)或化學發光酶(辣根過氧化物酶)進行信號識別。

圖45免疫印跡雜交分離表達文庫中的基因

另一種文庫篩選要借助酵母細胞表達體係,即利用酵母雙雜交篩選表達文庫中的基因。酵母雙雜交表達文庫的構建需要選用大腸杆菌酵母菌穿梭質粒載體,如pGADT7載體(圖42)。

以大腸杆菌為宿主細胞進行文庫構建並進行文庫的質量鑒定。提取文庫各克隆重組質粒混合DNA分子,轉化含有誘餌蛋白質粒pGBKT7的酵母細胞。文庫中各重組質粒分子進入酵母細胞後進行獵物蛋白的表達,酵母細胞中誘餌蛋白和獵物蛋白共同表達,如果兩者間發生相互作用,則驅動酵母細胞中各種報告基因的表達,使酵母細胞出現不同的表型,能夠在缺陷培養基上生長或可以使底物顯色(原理見第7章)。對特殊表型的酵母細胞進行質粒提取和序列分析,鑒定發生相互作用的克隆的DNA序列,獲取目的基因。

4.3圖位克隆法獲得目的基因

圖位克隆法(Mapbased cloning)是常用分離和克隆基因的方法之一,廣泛應用在植物基因的分離中。這種方法中無須預先知道基因的DNA序列,也無須預先知道其表達產物的有關信息,隻需要有特定的穩定遺傳的表型,利用分子標記技術分離鑒定與這種表型緊密連鎖的分子標記,確定基因在染色體上的定位。經典的方法中再通過文庫篩選和染色體步移的方法獲得包含該目的基因的克隆,最後通過遺傳轉化和功能互補驗證確定目的基因的堿基序列。隨著許多物種基因組的序列信息的釋放和功能注釋,可以獲得兩個緊密連鎖的分子標記間的多個候選基因序列和功能注釋,大大加快了後續的目的基因克隆。所以在基因的圖位克隆中,如何獲得與性狀緊密連鎖的分子標記是關鍵所在。

4.3.1分子標記的定義

分子標記的概念有廣義和狹義之分。廣義的分子標記是指可遺傳的並可檢測的DNA序列或蛋白質。狹義分子標記是指定位於染色體已知位點的一段DNA序列,在不同生物的個體或種群間存在序列差異,從而能夠區分不同生物的個體或種群。分子標記種類有很多,第一代分子標記以RFLP為代表,是基於酶切位點的多態性開發的分子標記。第二代分子標記以SSR,SSLP為代表,是基於簡單重複序列的多態性。第三代分子標記以SNP為代表,單核苷酸多態性,是基於高通量測序為基礎的新一代分子標記技術。在了解基因序列差異的基礎上,通過設計引物,以生物的基因組DNA為模板,用PCR的方法擴增出相關條帶,通過電泳、軟件識別、分析,可直觀展示分子標記的序列差異。

4.3.2常用分子標記的檢測

在下文中,我們將介紹三種常用的分析分子標記的方法:SSLP(Simple sequence length polymorphism,簡單序列長度多態性),CAPS(Cleaved amplified polymorphic sequence,酶切擴增多態性序列)和dCAPS(derived Cleaved amplified polymorphic sequence,衍生酶切擴增多態性序列)。SSLP屬於簡單重複序列的多態性類分子標記檢測方法;CAPS和dCAPS屬於單核苷酸多態性類分子標記檢測方法。