目前應(yīng)用的兩種快速序列測定技術(shù)是Sanger等(1977)提出的酶法及Maxam和Gilbert(1977)提出的化學(xué)降解法。雖然其原理大相徑庭,但這兩種方法都是同樣生成互相獨立的若干組帶放射性標(biāo)記的寡核苷酸,每組寡核苷酸都有固定的起點,但卻隨機(jī)終止于特定的一種或者多種殘基上。由于DNA上的每一個堿基出現(xiàn)在可變終止端的機(jī)會均等,因些上述每一組產(chǎn)物都是一些寡核苷酸混合物,這些寡核苷酸的長度由某一種特定堿基在原DNA全片段上的位置所決定。然后在可以區(qū)分長度僅差一個核苷酸的不同DNA分子的條件下,對各組寡核苷酸進(jìn)行電泳分析,只要把幾組寡核苷酸加樣于測序凝膠中若干個相鄰的泳道這上,即可從凝膠的放射自影片上直接讀出DNA上的核苷酸順序。
現(xiàn)行的邏終止法人加減法序列測定技術(shù)(Sacger和Coulson,1975)發(fā)展而來的。加減法首次引入了使用特異引物在DNA聚合酶作用下進(jìn)行延伸反應(yīng)、堿基特異性的鏈終止,以及采用聚丙烯酰胺凝膠區(qū)分長度差一個核苷酸的單鏈DAN等3種方法。盡管有了這些進(jìn)展,但加減法仍然太不精確,也太不得法,因此難以廣為接受。直至引入雙氧核苷三磷酸(ddTBP)作為鏈終止劑(Sanger等,1977 ),酶法DNA序列測定技術(shù)才得到廣泛應(yīng)用。2',3'ddNTP與普通dNTP不同之處在同它們在脫氧核糖的3' 位置缺少一個羥基。它們可以在DNA聚合酶作用下通過其5' 三磷酸基團(tuán)摻入到正在增長的DNA鏈中,但由于沒有3'羥基,它們不能同后續(xù)的dNTP形成磷酸二酯鏈,因此,正在增長的DNA鏈不可能繼續(xù)延伸。這樣,在DNA合成反應(yīng)混合物的4種普通dNTP中加入少量的一種ddNTP后, 鏈延伸將與偶然發(fā)生但卻十分特異的鏈終止展開競爭,反應(yīng)產(chǎn)物是一系列的核苷酸鏈,其長度取決于從用以起始DNA合成的引物末端到出現(xiàn)過早鏈終止的位置之間的距離。在4組獨立的酶反應(yīng)中分別采用4種不同的ddNTP,結(jié)果將產(chǎn)生4組寡核苷酸,它們將分別終止于模板鏈的每一個A、每一個G或每一個T的位置上。
Sanger法DNA測序的試劑
1.引物
酶促測序反應(yīng)中利用一個與模板鏈特定序列互補的合成寡核苷酸作為DNA合成的引物。在許多情況下,可將靶DNA片段克隆于M13噬菌體或噬菌粒載體,以取得單鏈DNA分子作為模板。但也可以采用Sanger 法商定變性雙鏈DNA模板的序列。在以上兩種情況下, 都可以采用能與位于靶DNA側(cè)翼的載體序列相退火的通用引物,而不必取得與未知DNA序列互補的引物。適于M13噬菌體重組克隆的通用測序引物一般長15-29 個核苷酸,并可與緊靠M13mp18噬菌體多克隆位點區(qū)的HindⅢ位點成M13mp19 噬菌體多克隆位點區(qū)的EcoRI位點的序列互補。這些引物同樣也可用于對克隆于pUC質(zhì)粒的DNA進(jìn)行“雙鏈”測序,并可從許多廠商中購置得到。此外,還有若干家公司出售一些引物,這些引物下為了對通過多種限制酶切位點克隆于不同質(zhì)粒的靶DNA進(jìn)行測序而設(shè)計的。
2.模板
如上所述,有兩類DNA可以用作Sanger 法測序的模板:純單鏈DNA和經(jīng)過熱變性或堿變性的雙鏈DNA。采用通常從重組M13噬菌體顆粒中分離得到的單鏈DNA應(yīng)中獲得數(shù)百個核苷酸的序列。如用變性雙鏈DNA用模板,則較難獲得這咱質(zhì)量的結(jié)果。盡管采用雙鏈DNA模板的方法顯然既簡單又方便(Chen和Seeburg,1985),然而只是在不久前得到改進(jìn)以后, 這一方法才發(fā)展到能夠獲得明確可信結(jié)果的水平。其中有兩個因素是至關(guān)重要的,這就是模板DNA的質(zhì)量和所用DNA聚合酶的種類。小量制箅的質(zhì)粒DNA常常被寡脫氧核糖核苷酸小分子、核糖苷酸及DNA聚合酶的抑制劑所污染,其中前兩種污染物可被用作隨機(jī)引物。結(jié)果,種種“鬼”帶、強終止現(xiàn)象,以及其他假象往往使測序凝膠含混不清、黯然失色。因此采用小量制備的質(zhì)粒NDA來測定未知DNA克隆片段的序列,并不可取。然而,這類DNA?勺鳛閷σ呀(jīng)通過另一方法測定的序列進(jìn)行進(jìn)一步的合適模板。采用CsCl-溴化乙錠梯度平衡離心法來純化質(zhì)粒DNA,測序的結(jié)果會好得多,但卻要耗費大量的人務(wù)和物力。模板鏈的每一個A、每一個G或每一個T的位置上。
3.DNA聚合酶
通常用于雙脫氧法序列測定的有幾種不同的酶,其中包括大腸桿菌DNA聚合酶I的Klenow片段(Sanger等,1977),反轉(zhuǎn)錄酶(見文獻(xiàn),如Mieredorf和Prfeffer,1987)經(jīng)過修飾消除了3'→5'外節(jié)酶活性的T7噬菌體DNA聚合酶(Sequenase)和測序酶2.0),Tabor和Richardson,1978]惟及從嗜熱水生菌(T'hermus aquaticus)分離的耐熱DNA聚合物(Taq DNA聚合酶)。這些酶的特性差別懸殊,因而可大大影響通過鏈終止反應(yīng)所獲得的DNA序列的數(shù)量的質(zhì)量。
(1)大腸桿菌DNA聚合酶IKlenow 片段 這種酶是最初用以建立Sanger法的酶,也是至今仍然廣泛用于DNA序列測定的酶。 通常碰到的兩個問題是:1)Koenow片段的持續(xù)合成能力低,以致一些片段并非由于dd NTP的摻入,而是因為聚合酸人模板上隨機(jī)解離而終止合成,因而導(dǎo)致背景增高。由于該酶不能沿模板進(jìn)行長中距離移動,因此利用該酶進(jìn)行的標(biāo)準(zhǔn)測序反應(yīng)所得序列的長度有限。通常,這一反應(yīng)只能得到大約250-350個核苷酸的序列。 如果分兩步進(jìn)行反應(yīng),所得序列的數(shù)目可以翻一番;其中第一步是初始標(biāo)記步驟,采用低濃度的dNTP,而隨后的第二步是鏈延伸-鏈終止反應(yīng),含有ddNTP和高濃度的dNTP(Johoston-Dow等,1987;Stambaugh和Blakesley,1988)。然而即使有了這些改進(jìn),用Klenow 酶所測序列的長度通常還是不如持續(xù)合成能力較強的測序酶。2)這種酶對模板中的同聚核苷酸段或其他含牢固二級結(jié)構(gòu)的區(qū)域進(jìn)行復(fù)制的效能很低。將聚合反應(yīng)的溫度提高到55℃,可以緩解但并不能徹底解決這一問題(Gomer和Firtel,1985)。有時可采用一些dNTP類似物[如dITP或7-脫氮dGTP(7-deaza-dGTP)]來獲取模板中可形成穩(wěn)定二級結(jié)構(gòu)的相應(yīng)區(qū)段的序列信息,但Kleow酶對這些類似物的作用不如測序酶有效,這也許是因為它們使Klenow酶原已較低的持續(xù)合成能力進(jìn)一步降低?偠赃@,可以選用大腸桿菌DNA聚合酶IKlenow片段測定從引物5'位置起250個堿基以內(nèi)的一段DNA序列, 但不宜用它來測定更長一段DNA序列或者具有二重對稱和(或)同聚核苷酸段的DNA序列。
(2)反轉(zhuǎn)錄酶 盡管日常測序工作并不廣泛使用反轉(zhuǎn)錄酶,但有時用這個酶解決一些由于模板DNA中存在A/T或G/C同聚核苷酸區(qū)而引起的問題。來自禽類和鼠類反轉(zhuǎn)錄病毒的反轉(zhuǎn)錄酶在這一看來要比Klenow酶略勝一籌(Karanthaansis,1982;Graham等,1986 ),盡管它們也許還是比測序酶遜色(Cameron-Mills,1988;Revak等1988)。
(3)測序酶: 測序酶(SequenaseTM)是一種經(jīng)過化學(xué)修飾的T7噬菌體DNA聚合酶。這酶原來具有很強的3'→5'外切核酸活性,經(jīng)過修飾后, 這一活性大部分均被消除。測序酶2.0版是測序酶的基因工程產(chǎn)品,它完全缺失了3' →5'外切核酸酶活性,極其穩(wěn)定而經(jīng)活性要比經(jīng)化學(xué)修飾的測序酶高2倍。測序酶持續(xù)合成能力很強,聚合速率很高,對諸如dITP和7-脫氮-dGTP等用于提高分子辨率使測序凝膠某些區(qū)段上的壓縮條帶得以分開的核苷酸類似物具有廣泛的耐受性。它是測定長段DNA序列的首選酶。測序酶可以沿模板移動很長的距離,因而一套反應(yīng)常常就可以測定數(shù)百個核苷酸的DNA序列。實際上,測得序列的長度更多是受聚丙烯酰胺凝膠的分辨能力而不是受該聚合酶的特性所制約。為了充分利用測序酶極高的持續(xù)合成能力,可采用兩步測序反應(yīng)。第一步首先采用低濃度的dNTP的較低溫度, 以便將合成反應(yīng)限制在適度之下并確保放射性標(biāo)記dNTP和較低溫度,以便將合成反應(yīng)限制在適度之下并確保放射性標(biāo)記dNTP的有效摻入,這步反應(yīng)的產(chǎn)物是僅僅延伸了20-30堿基的引物。 再將第一步反應(yīng)等分于4組1套的標(biāo)準(zhǔn)反應(yīng)系統(tǒng)中,每組反應(yīng)中都含有高濃度的d NTP和一種ddNTP。這樣聚合反應(yīng)就得以繼續(xù),直至造成鏈終止的核革酸摻入正在增長的鏈中。
(4)Taq DNA聚合酶 Taq DNA聚合酶適用于測定在37 ℃形成大段穩(wěn)定十級結(jié)構(gòu)的單鏈DNA模板序列。這是因為Taq DNA聚合酶在70-75℃活性最高,這一溫度下即使GC豐富的模板也無法形成二級結(jié)構(gòu)。按照1nnis 等(1988)介紹的方法使用Taq DNA聚合酶進(jìn)行測序,在放射自顯影片上得到的測序梯連續(xù)數(shù)百個堿基條帶始終清晰如一,表明這種酶的持續(xù)合成能力甚佳。模板鏈的每一個A、每一個G或每一個T的位置上。模板鏈的每一個A、每一個G或每一個T的位置上。
4.放射性標(biāo)記的dNTP
直至幾年以前,實際上所有DNA測序反應(yīng)都用[α-32P]dNTP來進(jìn)行。然而32P發(fā)射的強β粒子造成兩個問題。首先由于發(fā)生散射,放射自顯影片上的條帶遠(yuǎn)比凝膠上的DNA條帶更寬、更為擴(kuò)散,因此將影響到所讀取的序列(尤其是從放射自顯影片的上部所讀取的序列)的正確性并將制約從單一凝膠上能讀出的核苷酸序列的長度。其次32P的衰變會引起樣品中DNA的輻射分解,因此用32P進(jìn)行標(biāo)記的測序反應(yīng)只能保存一兩天,否則DNA將被嚴(yán)重破壞以至測序凝膠上模糊不清、真假莫辨。[35S]dATP的引入(Biggin等,1983)大大緩解了上述兩方面的矛盾。由于35S衰變產(chǎn)生較弱的β粒子,其散射有所減弱,凝膠和放射自顯影片之間在分辨率上相差無幾,因此可以從一套反應(yīng)中確切測定數(shù)百核苷酸的DNA序列。此外,35S的低能輻射所引起的樣品分解比較輕微,因此,測序反應(yīng)可在-20℃保存至1周,而分辨率不見下降。這樣,職果聚丙烯酰胺凝膠方面了發(fā)生技術(shù)故障,只要對測序反應(yīng)進(jìn)行重分析即可。
5.dNTP類似物
二重對稱的DNA區(qū)段(特別是GC含量高者)可以形成鏈內(nèi)二級過程中不能充分變性。因此將引起不規(guī)則遷移,使鄰近的DNA條帶壓縮在一起,以致難以讀出序列。這種壓縮現(xiàn)象歸因于DNA二級結(jié)構(gòu)的存在,而且不可能通過改變測序反應(yīng)中出序列。這種壓縮現(xiàn)象歸因于DNA二級結(jié)構(gòu)地存在,而且不可能通過改變測序反應(yīng)中所用DNA聚合酶的種類而得到減輕。但是凝膠中的壓縮區(qū)段往往可以通過采用諸如dITP(2'-脫氧次黃苷15' -三磷酸)或7-脫氮-dGTP(7-脫氮-2'-脫氧鳥苷-5' -三磷酸)等核苷酸類似物進(jìn)行分辨。這些類似物與普通堿基的配對能力較弱,而且是測序酶和Taq DNA聚合酶等DNA聚合酶的合適底物(Gough和Murray,1983;Mixusawa等,1986;Innis等,1988)。但對某些壓縮條帶,7-脫氮-dGTP無濟(jì)于事;同樣,dITP也無補于另一壓縮條帶(尤其是得于GC豐富區(qū)的縮條帶)的分辨。如果需要采用類似物,首先可試用dOTP,如果壓縮條帶用d ITP或7-脫氮-dGTP都無法分辨, 則轉(zhuǎn)而測定另一條鏈的DNA序列幾乎總能如愿以償。如上所述,兩種形式的測序酶和Taq DNA聚合酶對核苷酸類似物的耐受性優(yōu)于大腸桿菌DNA聚合酶IKlenow片段。此外,制造廠商聲稱在測定含穩(wěn)固二結(jié)構(gòu)的模板序列時,測序酶2.0版要優(yōu)于原來的測序酶。測序酶2.0版持續(xù)合成能力強于測序酶,其作用總是一氣呵成,很少半途而廢,因而消除了“鬼”帶。 而且,測序酶2.0版對諸如dITP類核苷酸類惟物的耐受性看來也優(yōu)于原來的測序酶。
二、Maxam-Gilbert DNA化學(xué)降解法
與包括合成反應(yīng)的鏈終止技術(shù)不同,Maxam-Gilbert法要對原DNA進(jìn)行化學(xué)降解。這一方法是在體外研究lac阻抑制與lac操縱基因相互作用時醞釀發(fā)展起來的。時至今日,可以探測DNA構(gòu)象的蛋白質(zhì)-DNA相到作用,仍然是Maxam- Gilbert法獨具的鮮明特點。在這一方法(Maxam和Gilbert,1980)中,一個末端標(biāo)記的DNA片段在5組互相獨立的的化學(xué)反應(yīng)分別得到部分降解,其中每一組反應(yīng)特異地針對某于種或某一類堿基。因此生成5組放射性標(biāo)記的分子,從共同起點(放射性標(biāo)記末端)延續(xù)到發(fā)生化學(xué)降解的位點。每組混合物中均含有長短不一的DNA分子,其長度取決于該組反應(yīng)所針對的堿基在原DNA全片段上的位置。此后,各組均通過聚丙烯酰胺凝膠電泳進(jìn)行分離,再通過放射自顯影來檢測末端標(biāo)記的分子。相對而言,Maxam-Gilbert法自初次提出以來,基本沒有變化。雖然設(shè)計了另一些化學(xué)降解反應(yīng)(見綜述:Ambrose和Pless,1987),但這些反應(yīng)一般只作為Maxam和Gilbert(1977,1980)最早提出的反應(yīng)的補充。這一方法的成敗,完全取決于上述這些佞兩步進(jìn)行的降解反應(yīng)的特異性。第一步先對特定堿基(或特定類型的堿基)進(jìn)行化學(xué)修飾,而第二步修飾堿基從糖環(huán)上脫落,修飾堿基5'和3'的磷酸二酯鏈斷裂。在每種情況下,這些反應(yīng)都要在精心控制的條件下進(jìn)行,以確保每一個DNA分子平均只有一個靶堿基被修飾。隨后用哌啶裂解修飾堿基的5'和3'位置,得到一組長度從一到數(shù)百個核苷酸不等的末端標(biāo)記分子。比較G、A+G、C+T、C和A>C各個泳道, 右從測序凝膠的放射自顯影片上讀出DNA序列。由于種種原因(如采用32P進(jìn)行放射性標(biāo)記、末端標(biāo)記DNA的比活度、裂解位點的統(tǒng)計學(xué)分布、凝膠技術(shù)方面的局限性等等),Maxam-Gilber法所能測定的長充要比Sanger法短一些,它對放射性標(biāo)記末端250個核苷酸以內(nèi)的DNA序列效果最佳。在70年代Maxam-Gilbert法和Sanger法剛剛問世時,利用化學(xué)降解進(jìn)行測序不但重現(xiàn)性更高,而且也容易為普通研究人員所掌握。Sanger 法南非要單鏈模板和特異寡核苷酸的,并需獲得大腸桿菌DNA聚合酶IKlenow 片段的高質(zhì)量酶制劑,而Maxam-Gilbert法只需要人所共的簡單化學(xué)試劑。但隨著M13 噬菌體和噬菌粒載體的發(fā)展,也由于現(xiàn)成的合成引物唾手可得及測序反應(yīng)日臻完善,雙脫氧鏈終止法如今遠(yuǎn)比Maxam-Gilbert法應(yīng)用得廣泛。然而,化學(xué)降解較之鏈終止法具有一個明顯的優(yōu)點:所測序列來自原DNA分子而不是酶促合成所產(chǎn)生的拷貝。因此,利用Maxam-Gilbert法可對合成的寡核苷酸進(jìn)行測序,可以分析諸如甲基化等DNA修飾的情況,不可以通過化學(xué)保護(hù)及修飾干擾實驗來研究DNA二級結(jié)構(gòu)及蛋白質(zhì)與DNA的相互作用。然而,由于Sanger法既簡便又快速,因此是現(xiàn)今的最佳選擇方案。事實上,目前大多數(shù)測序策略都是為Sanger法而設(shè)計的。 類核苷酸類惟物的耐受性看來也優(yōu)于原來的測序酶。
三、測序策略
確證性測序
從頭測序
開始測序之前,必須根據(jù)待測序列區(qū)的長度,所要求的測序精確度以現(xiàn)有有設(shè)施來制定測序總策略。只有一小部分的研究劃需需分從頭測定大段從測定過和序列,而列多的情況是通過測序?qū)ν蛔儯ㄈ琰c突變和缺失)進(jìn)行定位和鑒定,并證實構(gòu)建的重組DNA的方向與結(jié)構(gòu)。用于上述兩種目的的方略大不相同。
(一)確證性測序
確證性測序(例如對利用寡核苷酸倡導(dǎo)的誘變而產(chǎn)生的突變體進(jìn)行測序)往往只需要僅僅一套反應(yīng),以取得雙鏈DNA其中一條鏈上局部區(qū)域的核苷酸序列,通常只須對亞克隆于M13噬菌體或噬菌粒載體上的一段合適的限制酶切片段進(jìn)行測序,即可如原以償。在許多情況下,等測區(qū)落于通用引物的測序范圍之內(nèi);若不然,最好的方法就是合成一段長度為17-19核苷酸的寡核苷酸引物,與距離待測區(qū)約50-100核苷酸的序列互補。只要可能,應(yīng)同時測定野生型基因上同源區(qū)的序列和突變的相應(yīng)序列。直接在同一張放射自顯影片上對照有關(guān)序列,極有助于確證變異區(qū)序列并將使突變體與野生型基因之間任何出乎意料之外的其他差異一目了然。
(二)從頭測序
從頭測序的目的是要提供一段DNA的準(zhǔn)確核苷酸序列,這一區(qū)段可長達(dá)數(shù)千堿基,而其序列從來未經(jīng)測定。由于單套測序反應(yīng)所能準(zhǔn)確測定的靶DNA序列最長可達(dá)400堿基左右,因引進(jìn)行從頭側(cè)序必須經(jīng)過精心策劃。長約400堿基的枝DNA可以按互為相反的方向分別克隆于2種M13噬菌體載體(如M13mp18 和13mp 119)上。然后每條鏈的全序列可以通過利用通用測序引物進(jìn)行的單套反應(yīng)得以測定。如果要對更長的靶DNA(如長達(dá)數(shù)千堿基)進(jìn)行測序,則可在兩種通用策略中一而行:
(1)隨機(jī)法(或鳥槍測序法) 在隨機(jī)法中,序列資料是從含有靶DNA隨機(jī)片段的亞克隆中收集而來的。既不須努力確定這些亞克隆在靶DNA中的位置,也不必設(shè)法查明究竟測出的是哪一條鏈的序列,只要把積累資料貯存起來,最后可用計算機(jī)排列妥當(dāng)(Staden,1986)。這一方法是由劍橋的醫(yī)學(xué)研究委員會(M.R.C.)實驗室率推行的,曾經(jīng)成功地用于測定人線粒體DNA(Anderson 等,1981)、人腺病毒DNA(Gingeras等,1982;Roberts等,1986)、λ噬菌體DNA(Sanger等,1982),以及Epstenin-Barr病毒DNA(Baer等, 1984)的序列。
(2)定向法 在定向法中,靶DNA的測序按計劃有秩序地進(jìn)行。例如,靶DNA的全序列可以通過測定一系列嵌套的缺失突變體的序列而獲得,這些突變體具有相同的起點(通常在靶DNA的一端)并分別穿入靶序列區(qū)縱深不同距離處,因此它們可以使靶DNA中更遙不可及的區(qū)段漸進(jìn)地落入可利用通用引物進(jìn)行測序的范圍之中。另一種方法是,利用一套反應(yīng)中取得的核苷酸序列設(shè)計新的寡核苷酸充當(dāng)后續(xù)一套反應(yīng)的引物,從而循序漸進(jìn)地獲得從示測定過的靶DNA片段的序列。因此在這一方法中。DNA序列的積累是通過沿DNA鏈漸進(jìn)移動引物結(jié)合位點而實現(xiàn)的。盡管對隨機(jī)法與定向法的取舍通常由實驗室的物力與專長所決定,但仍有一少其他因素也會影響最終的抉擇,這些將在稍后加以討論。
選擇隨機(jī)定向測定策略的影響因素
(1)計算設(shè)備 任何大規(guī)模的測序計劃將在很大程度上依賴計算機(jī)程序?qū)υ夹蛄匈Y料進(jìn)行分類、整理和排列(Staden,1986)。在權(quán)衡隨機(jī)法的利與弊之時,必須將與適當(dāng)?shù)挠嬎銠C(jī)設(shè)備進(jìn)行聯(lián)機(jī)的問題放到壓倒一切的位置上來考慮。如果這些設(shè)備尚無從適當(dāng)?shù)挠嬎銠C(jī)設(shè)備進(jìn)行聯(lián)機(jī)的問題放到壓倒一切的位置上來考慮。如果這些設(shè)備尚無從談起,就必須將采用隨機(jī)策略的想法束之高閣,轉(zhuǎn)而從前已述及的兩種定向方法中擇一而行。
(2)靶DNA的性質(zhì):如果靶DNA很可能會有散在的重復(fù)序列,那么就應(yīng)當(dāng)組建嵌套的缺失體用于測序。計算機(jī)在區(qū)分重復(fù)序列方面可能束手無策,而寡核苷酸引物則會同多個位點發(fā)生退火。
(3)完成測序計劃所需時間:完成一個測序計旬所需工作蜈可通過以下指示進(jìn)行估計:
1)從單套反應(yīng)中平均可是300-400核苷酸的序列。
2)一個人一天可以輕松自如地操作24-32套反應(yīng)。
3)因此一個測序工作周,可以測出15kb核苷酸序列,這一周包括:
a.用一天時間制備單鏈DNA模板。
b.用一天時間測定DNA序列。
c.用一天讀出原始DNA序列并加以排列。
d.再用兩天生物旱生測序、重新進(jìn)行電泳,以便澄清模棱兩可這處并取得各個克隆之間的重疊區(qū)序列。
采用隨機(jī)法,所要測定的序列通常會比靶DNA所具有的實際長度4-6倍。在大多數(shù)情況下,直至雙鏈90%左右的序列測出以后,才能得到單一的一段鄰接不斷的序列。由于進(jìn)行測序的亞克隆是隨機(jī)挑選出來的,因此靶DNA某些區(qū)段的序列在全段序列未能測出前會被重復(fù)測定,至于需要多長時間才能找出最后幾個亞克隆并進(jìn)行測序,從而使序列提以測全,則無法未卜先知。往往會發(fā)現(xiàn),以上亞克隆在文庫中得不到充分反映,因此南非要處用與側(cè)翼序列相應(yīng)的寡核苷酸探針進(jìn)行篩選,以分離這些亞克隆。利用限制酶將大分子靶DNA進(jìn)一步分為大小適中(4-5kb)而易于處理的片段,可以使上述推理上難題得以緩和,每一個這樣的片段都可以用隨機(jī)法單獨進(jìn)行測序。
定向缺失法有時需要投入大量的時間生成并鑒定一整套嵌套的缺失體。然而一旦這上步水到渠成,則可以從靶DNA上早以妥善安排的多個區(qū)段上互為相反的兩端向內(nèi)部延伸,才能測定DNA雙邏的全序列。另一種辦法是用單套缺失突變體來取得靶DNA單鏈的序,然后利用其信息合成一套寡核苷酸引物,以便用于確證DNA互補鏈的序列(見后)。
(4)使用寡核苷酸合成儀的方便程度:如果能夠無拘無束地使用寡核苷酸合成儀,則可快速、廉價地合成由用戶設(shè)計的引物。假定要花1-2天時間來合成一個寡核苷酸,那么在最快速度下每周可以由靶DNA的一個特定起點開始從頭測定600-800個核苷酸的序列。如果同時使用幾個起點開始從頭測序; 或者也可以將M13mp18和M13mp19噬菌體載體,利用通用引物同時從兩端開始測序;或者也可以將序列內(nèi)部的限制酶切片段亞克隆循下列原則:設(shè)計DNA測序物時,應(yīng)遵循下列原則:
1)應(yīng)寡核苷酸與靶DNA的正確主靶DNA中確鑿疑的序列相互補。尤其是利用循序漸進(jìn)的寡核苷酸法來測定從未測過的DNA序列時,這一點更加重要。盡量讓新設(shè)計的寡核苷酸互補于已知序列的最遠(yuǎn)端,這是十分自然的人民代表傾向。然而在大多數(shù)情況下,該序列是從測序凝膠頂部間隔緊密的條帶中讀取的,而在此處發(fā)生閱讀錯誤往往司空見慣。因此緊好保守一些,讓所設(shè)計的引物與位于樣品泳前沿之后一定距離內(nèi)的序列機(jī)互補,在凝膠的這一區(qū)段上讀出的序列可信程度較高。
2)引物的堿基組分比便應(yīng)勻稱[40-55%(G+C)], 而且長度至少應(yīng)有18個核苷酸。 如果(G+C)%
在上述閾值之外,應(yīng)將寡核苷酸長度設(shè)計為(18+n/2)個核苷酸,其中對AT豐富區(qū),則n=50-(G+C)%對GC豐富區(qū),則n=(G+C)%-50。
3)檢查新設(shè)計二重對稱區(qū),因為可自雜交形在發(fā)夾或莖環(huán)結(jié)構(gòu)的寡核苷酸是低物。效引
a.其中不含二重對稱區(qū),因為可自雜交形成發(fā)夾或莖環(huán)結(jié)構(gòu)地寡核苷酸是低效引物。
b.它既不會同載體DNA也不會同序列已經(jīng)測出的靶DNA區(qū)段相互補,如能保證這一點,將大大減少寡核苷酸從模板DNA的不只一個位置上引導(dǎo)DNA合成的可能性。已商品化的大部分用于DNA分析的計算機(jī)程序都能夠從序列中檢索合成寡核苷酸的互補區(qū)。
(5)序列的準(zhǔn)確性:如果認(rèn)真地進(jìn)行DNA序列測定,錯誤率將小于0.1 %。但要達(dá)到這樣高的準(zhǔn)確性,必須完整地測定靶DNA兩條鏈的序列并澄清棱兩可及相互矛盾之處。在這一點上隨機(jī)測序有其優(yōu)點,因為在該方法中耐需要驟步對豐余的原始序列資料進(jìn)行累積,從而使最終所排出的序列的準(zhǔn)確性大為改觀。然而靶DNA中可能存在一些區(qū)域,無論采用隨機(jī)法還是定向法都不能準(zhǔn)確測定其序列。解決這些凝難序列往往需要花費意外長的時間,有時還要使用堿基類似物(以消除條帶壓縮現(xiàn)象)或Maxam-Gilbert測序法。
(6)測序計劃的下一步打算:不同的測序策略將會得到不同類型的樣品材料,這些材料可用于以后的實驗。例如,為NDA測序而構(gòu)建的多套缺失體可用于研究啟動子區(qū)中的結(jié)構(gòu)域,而與靶片段不同區(qū)段互補的多套寡核苷酸,可用于測定靶DNA突變體的序列。為鳥槍法測序而構(gòu)建可以留作隨后進(jìn)行定點誘變或制備放射性標(biāo)記探針的材料。