怎樣優(yōu)化設(shè)計寡核苷酸呢?至少有下列幾個方面的問題需要考慮。
1. 估測可能形成的DNA或RNA雙鏈的穩(wěn)定性
寡核苷酸,無論是DNA的或者RNA的,都有形成雙鏈結(jié)構(gòu)的潛在可能性,正如下面反復(fù)提到的,這種結(jié)構(gòu)對寡核苷酸的作用有很大影響。所以,預(yù)測這種結(jié)構(gòu)的穩(wěn)定性對設(shè)計和優(yōu)化寡核苷酸就很重要。在一個雙鏈結(jié)構(gòu)中,堿基對的相對穩(wěn)定性是由其鄰近堿基決定的。在熱動力學(xué)中,這樣的性質(zhì)以雙鏈形成時的自由能(ΔG)來表示,F(xiàn)在,大多采用 Breslauer等人提出的,以最接近的相鄰核苷酸的動力學(xué)數(shù)值(自由能)來預(yù)測雙鏈穩(wěn)定性的方法。為簡化起見,所有的計算都在25 ℃條件下進行。此時,最接近的相鄰核苷酸的自由能是:
第一個(5′)核苷酸 |
第二個核苷酸 |
|||
dA |
dC |
dG |
dT |
|
dA |
-1.9 |
-1.3 |
-1.6 |
-1.5 |
dC |
-1.9 |
-3.1 |
-3.6 |
-1.6 |
dG |
-1.6 |
-3.1 |
-3.1 |
-1.3 |
dT |
-1.0 |
-1.6 |
-1.9 |
-1.9 |
ΔG(kcal/mol)
例如,雙鏈d(ACGG/CCGT)的ΔG是:
ΔG(ACGG)=ΔG(AC)+ΔG(CG)+ΔG(GG)=-(1.3+3.6+3.1)=-8.0 kcal/mol
此計算方法特別適用于測定其3′末端會形成雙鏈的引物的相容性。也可以用來計算發(fā)夾環(huán)結(jié)構(gòu)的ΔG。不過,這時需要根據(jù)環(huán)區(qū)內(nèi)核苷酸的數(shù)量添加一定的數(shù)值。如3個核苷酸時為5.2 kcal/mol;4個時為4.5;5個為4.4;6個是4.3;7和8個為4.1 kcal/mo1。
2. 選擇引物的一般規(guī)則
設(shè)計和選擇引物時有5個要素必需注意。
2.1 引物的3′末端不互補 引物的3′末端一定不能有很大的互補性,因為它們的互補會形成引物二聚體,這就會帶來很大的問題,例如合成出非專一的產(chǎn)物,極大地減少所期望產(chǎn)物的得量。有實驗表明,3′末端雙鏈的ΔG是0~-2 kcal/mol時,PCR產(chǎn)量幾乎達到百分之百,隨著其絕對值的增加產(chǎn)量逐漸下降,在-6時只有40%,到-8時少于20%,而-10時,接近于0。雖然產(chǎn)量還取決于其他參數(shù),如退火溫度、引物的專一性等等,但是用Taq聚合酶操作時,由于它的工作能力很強,能夠在很短的時間內(nèi)就識別3′末端互補的雙鏈區(qū)并發(fā)動聚合反應(yīng),即使3′末端雙鏈的穩(wěn)定性很差也不能阻礙它的作用,所以這時產(chǎn)量對二聚體的形成就有很大的依賴性。
2.2 引物分子內(nèi)不互補 應(yīng)當盡量不用會通過釋放能量而形成分子內(nèi)雙鏈結(jié)構(gòu)的寡核苷酸。雖然有些帶有發(fā)夾環(huán),其ΔG為-3 kcal/mol的自身互補引物也可以得到不錯的結(jié)果,但是如果它的3′末端被發(fā)夾環(huán)占據(jù)時就很麻煩,即會引發(fā)引物內(nèi)部的延伸反應(yīng),減少了參與正式反應(yīng)引物的數(shù)量。當然,如果發(fā)夾環(huán)在5′末端對反應(yīng)就沒有多大的影響了。
2.3 引物的組分、解鏈溫度和長度 普遍認為PCR引物應(yīng)當有50%的GC/AT比率。其實,這是不對的。以人基因組DNA為模板,用81% AT的引物可以產(chǎn)生單一的,專一的,長250 bp,含有70% AT的產(chǎn)物。完全沒有必要復(fù)雜地去計算產(chǎn)物和引物的解鏈溫度,PCR引物的GC/AT比率應(yīng)當?shù)扔诨蚋哂谒糯蟮哪0宓腉C/AT比。
要知道,更重要的因素是模板與穩(wěn)定性較小的引物之間解鏈溫度的差異。差異越小,PCR的效率越高。因為DNA的解鏈溫度也取決于它的長度,所以有的研究者喜歡設(shè)計很長,而不求它很穩(wěn)定的引物?墒牵锾L就難以避免形成二聚體和自身互補,因此,一般還是不用為好。如果期待的產(chǎn)物長度等于或小于500 bp,選用短的(16~18 mer)的引物:若產(chǎn)物長5 kb,則用24 mer的引物。有人用20~23 mer引物得到40 kb的產(chǎn)物。但是,引物較長時,如果不借助引物選擇的計算機軟件幫助,就很難確定一對引物是否會形成二聚體,是否有自身互補性以及專一性如何。于是,用眼睛選出來的寡核苷酸放大長片段DNA時就會使引物彼此引發(fā)而不是延伸模板,得出非專一產(chǎn)物。通過下述的觀察內(nèi)部穩(wěn)定性原理可以極大地減少這種問題。
2.4 引物的內(nèi)部穩(wěn)定性 在DNA測序和PCR中最好用5′末端穩(wěn)定(如GC含量較多),而3′末端不太穩(wěn)定(如AT含量較多)的引物,這種引物的結(jié)構(gòu)可以有效地消除假引發(fā)反應(yīng)。這就是基于引物內(nèi)部穩(wěn)定性的經(jīng)驗之談。其3′末端穩(wěn)定性低的引物在這些反應(yīng)中能起好作用的原因在于,接近或在3′末端上的堿基與非靶位點堿基所形成的配對的穩(wěn)定程度還不足以引發(fā)DNA合成,所以不會產(chǎn)生假產(chǎn)物。因此,為了有效地引發(fā)反應(yīng),引物的5′末端和中央部分必須與靶DNA也形成雙鏈。與此相反,帶有穩(wěn)定的、GC豐富的3′末端的寡核苷酸不需要其所有的核苷酸序列都與靶序列配對,只憑借其3′末端與靶序列任何位點的牢固配合就可以引發(fā)反應(yīng),產(chǎn)生非專一產(chǎn)物。
如果用3′末端低穩(wěn)定性的引物,反應(yīng)的最適退火溫度范圍會不尋常的寬。這就可以不經(jīng)過事先的最佳化實驗就能在最佳條件下進行反應(yīng)。還要注意的是PCR反應(yīng)產(chǎn)物的質(zhì)量還取決于模板(底物的復(fù)雜性、Tm、產(chǎn)物長度)和退火的溫度與時間。
所以,有時3′末端穩(wěn)定的引物也可以滿意地進行反應(yīng)。但是,無論如何,寡核苷酸3′末端最后5個核苷酸的穩(wěn)定性小于-9 kcal/mol的,通常就是專一性的探針或引物。寡核苷酸3′末端越不穩(wěn)定,假引發(fā)的可能性越低。
2.5 引物的唯一性 為了放大單個的、專一性DNA片段,選用的引物序列就應(yīng)當是唯一的,即在模板中沒有重復(fù)序列。雖然不會整個引物序列都偏好于和模板中的一個以上位點匹配,但是,通常見到的引物的3′末端往往都有6~7個沒有什么個性的核苷酸。如果假引發(fā)的位點正好在放大區(qū)的內(nèi)部,那麻煩就大了。由于短的DNA片段有更高的PCR或雜交效率,就容易產(chǎn)生非專一產(chǎn)物。
如果用哺乳動物基因組序列作為模板,可以用Alu序列或其他短重復(fù)元件來核對想用的引物的互補性。由此也可知,應(yīng)當避免使用同寡聚物(如—AAAAAA—)和二核苷酸重復(fù)(如—ATATAT—)。
3. 按照氨基酸序列設(shè)計寡核苷酸
按照多肽的氨基酸序列來設(shè)計 PCR引物或雜交探針是最常用的實驗手段,尤其是在試圖“釣取”一個蛋白質(zhì)的基因時。此時要注意的問題有:
(1)寧可用簡并引物,也不用猜測的引物。氨基酸密碼子的簡并性給予引物設(shè)計以可塑性,這比用猜測的密碼子要好得多。有人用1 024個簡并引物得到很好的結(jié)果。
但是,應(yīng)當避免在一個區(qū)域內(nèi)有很高的簡并性。但也有簡并性低使引物不工作的報道。
(2)引物與模板的錯配。一般認為,所用引物與模板有15%~20%的錯配,PCR的效果還能接受。但是,引物3′末端的錯配比同樣錯配率的5′末端錯配會引起更嚴重的問題。
在最后4個堿基中有2個錯配的引物,其 PCR產(chǎn)量急劇下降。但是,當核苷酸濃度高時,3′末端有錯配的引物還能被Tag聚合酶很好地利用。在0.8 mmol/L時,大多數(shù)3′末端錯配引物可以接受,雖然非專一產(chǎn)物比較多,DNA合成的忠實性也下降。即使在低核苷濃度下,還會有少量從錯配堿基出發(fā)的合成,因此,在開始的PCR循環(huán)中把退火時間增加到3~5分鐘,比之于用標準退火時間和高濃度核苷酸能夠產(chǎn)生質(zhì)量更好的所求產(chǎn)物。
(3)在用唯一性引物時,建議用0.2 mmol/L或更低的總核苷酸濃度,因為高濃度會增加錯誤參入的比率。
(4)簡并寡核苷酸時,PCR應(yīng)當在比較高的引物濃度下進行,即1~3 μmol/L而不是0.2 μmol/L,因為在反應(yīng)混合物中的大多數(shù)寡聚物并不是被用來引發(fā)專一的反應(yīng),而只是產(chǎn)生高的背景而已。