限制性內切酶綜述及分類指南
發現限制性內切酶
40 年前,當人們研究細菌對抗噬菌體宿主特異性的限制-修飾現象時發現了限制性內切酶。人們普通認為,限制性內切酶能保護細菌不受噬菌體的感染,行使微生物免疫功能。缺乏限制性內切酶的 E. coli 菌株極易被噬菌體感染,但如果這類細菌體內存在限制性內切酶,被成功感染的機率就會明顯降低。擁有的限制性內切酶種類越多,保護作用也就越強;一種擁有四、五種不同限制性內切酶的細胞就幾乎不受感染。
*被發現的限制性內切酶包括來源于大腸桿菌的 EcoRI 和 EcoRII,以及來源于流感嗜血桿菌的 HindII 和 HindIII。
這些酶可在特定位點切開 DNA,產生可體外連接的 DNA 片段。不久,研究者就發現內切酶是研究基因的組成、功能及表達非常有用的工具。
當限制性內切酶的應用在二十世紀 70 年代末開始流傳時,以 NEB 為代表的許多公司開始尋找更多的限制性內切酶。除了某些病毒以外,限制性內切酶僅在原核生物中被發現。如今,人們已經從數以千計的細菌及古細菌中尋找過限制性內切酶。
原核基因組序列分析數據表明,限制性內切酶在原核生物中普遍存在,所有自由生存的細菌和古細菌似乎都能編碼限制性內切酶。
限制性內切酶的形式多樣,小到如 157 個氨基酸的 PvuII,大者甚于 1,250 個氨基酸的 CjeI。在已純化分類的 3,000 多種限制性內切酶中,已發現 250多種不同序列特異性的內切酶,其中超過 30% 是由 NEB 發現并深入研究的。人們不僅從生化角度分析細胞提取物,也采用計算機分析已知的基因組數據,以期能發現更多的識別未知特異序列的限制性內切酶。
盡管很多新發現的酶的識別序列與已有的一致,即同裂酶,但仍然有許多識別新位點的酶在不斷被發現。
二十世紀 80 年代初,NEB 開始克隆并表達限制性內切酶。克隆技術將限制性內切酶的表達與原有細胞環境分離開來,避免了原細胞中其它內切酶的污染,提高了酶的純度。此外,克隆技術能提高限制性內切酶的產量,簡化純化過程;而且克隆的基因易于測序分析,其表達蛋白可進行 X- 射線晶體結構分析,有利于進一步鑒定克隆產物。
限制-修飾(R-M)系統
大多數限制性內切酶常常伴隨有一、兩種修飾酶(甲基化酶),后者能保護細胞自身的 DNA 不被限制性內切酶破壞。修飾酶識別的位點與相應的限制性內切酶相同,它們的作用是甲基化每條鏈中的一個堿基,而不是切開 DNA 鏈。甲基化所形成的甲基基團能伸入到限制性內切酶識別位點的雙螺旋大溝中,阻礙限制性內切酶發揮作用。這樣,限制性內切酶和它的“搭檔”修飾酶一起組成 R-M 系統。在某些 R-M 系統中,限制性內切酶和修飾酶是兩種不同的蛋白,它們各自獨立行使自己的功能;另一些 R-M 系統本身就是一種大的限制-修飾復合酶,由不同亞基或同一亞基的不同結構域來分別執行限制或修飾功能。
限制性內切酶分類
按照亞基組成、酶切位置、識別位點和輔助因子等不同,傳統上將限制性內切酶分為四大類。然而,蛋白測序的結果表明,限制性內切酶的變化多種多樣,若從分子水平上分類,則遠遠不止四類。
Ⅰ型限制性內切酶是一類兼有限制性內切酶和修飾酶活性的多亞基蛋白復合體。它們可在遠離識別位點處任意切割 DNA 鏈。
以前認為Ⅰ型限制性內切酶很稀有,但基因組測序分析發現這類酶其實很常見。盡管Ⅰ型酶在生化研究中很有意義,但其不能產生確定的限制片段和明確的凝膠電泳條帶,因而不具備實用性。
Ⅱ型限制性內切酶能在其識別序列內部或附近特異地切開 DNA 鏈。它們產生確定的限制性片段和凝膠電泳條帶,因此是*一類用于 DNA分析和克隆的限制性內切酶。Ⅱ型限制性內切酶由一群性狀和來源都不盡相同的蛋白組成,因而它們的氨基酸序列可能截然不同。如今看來,這些酶很可能是在進化過程中獨立產生的,而非來源于同一個祖先。
zui常見的 Ⅱ 型限制性內切酶在特異性識別序列內部切割 DNA,如 HhaI、HindIII 和 NotI,商業化酶多屬此類。它們一般以同源二聚體的形式結合到 DNA 上,識別對稱序列;但也有少量的酶與DNA 結合形成異二聚體,識別非對稱序列(如BbvCI 識別 CCTCAGC)。一些酶識別連續性序列(如 EcoRI 識別 GAATTC,其中的兩個半識別序列是相連的);而另一些識別非連續性序列(如 BglI 識別GCCNNNNNGGC,其中的兩個半識別序列是不相連的)。限制性內切酶切割后產生一個 3' -羥基和一個 5' -磷酸基。只有當鎂離子存在時,它們才有切割活性,相應的修飾酶則需要 S- 腺苷甲硫氨酸的存在。這些酶一般都比較小,亞基約 200-350 個氨基酸。
另一種比較常見的 Ⅱ 型限制性內切酶是所謂的ⅡS 型酶,如 FokI 和 AlwI,它們在識別位點之外切開 DNA。這些酶大小居中,約 400-650 個氨基酸,由 DNA 結合域和切割 DNA 的功能域組成。它們識別連續的非對稱序列。一般認為這些酶主要以單體的形式結合到 DNA 上,與鄰近酶分子的切割功能域結合成二聚體,協同切開 DNA鏈。因此一些ⅡS 型酶在切割含有多個識別位點的 DNA 分子時活性更高。
第三種常見的Ⅱ型限制性內切酶是ⅡG 型限制性內切酶,由限制酶和修飾酶聯合組成,分子量較大,通常由 850-1,250個氨基酸組成,在同一蛋白上表現有限制和修飾兩種活性。此類酶在其識別序列外進行切割;那些識別連續性序列的 IIG 內切酶、(如 AcuI 識別 CTGAAG)僅在識別位點的一端切割 DNA 鏈;而那些識別非連續性序列的 IIG 內切酶(如 BglI識別 GCCNNNNNGGC),會在識別位點的兩端切割 DNA 鏈,產生一小段含識別序列的片段。這些酶的氨基酸序列各不相同,但其結構組成是一致的,N 端為 DNA 切割和修飾域;C 端為一、兩個識別特異 DNA 序列的結構域,該域也能以獨立的亞基形式存在。這些酶與底物結合時,它們或行使限制性內切酶的功能切開底物,或作為修飾酶將其甲基化。
Ⅲ 型限制性內切酶也是一類較大的兼有限制-修飾兩種功能的酶。它們在識別位點之外切開 DNA 鏈,并且要求同一 DNA分子中存在兩個反向的識別序列以完成切割。這類酶很少能達到*切割。
Ⅳ 型限制性內切酶識別經典甲基化的和修飾的 DNA。以 E. coli 的 McrBC 和 Mrr 系統為代表。