簡(jiǎn)并引物設(shè)計(jì)的方法(包括實(shí)際操作步驟)簡(jiǎn)并引物是指用來編碼一段短肽序列的不同堿基序列的混合物。主要用來同源克隆未知的基因,或用來分析某一種基因多態(tài)性的一種方法。
簡(jiǎn)并引物設(shè)計(jì)的常見程序如下:
1. 利用ncbi搜索不同物種中同一目的基因的蛋白或cDNA編碼的氨基酸序列。
因?yàn)槊艽a子的關(guān)系,不同的核酸序列可能表達(dá)的氨基酸序列是相同的,所以氨基酸序列才是真正保守的。首先利用NCBI的Entrez檢索系統(tǒng),查找到一條相關(guān)序列即可。隨后利用這一序列使用BLASTp(通過蛋白查蛋白),在整個(gè)Nr數(shù)據(jù)庫(kù)中中查找與之相似的氨基酸序列。
2. 對(duì)所找到的序列進(jìn)行多序列比對(duì)。
將搜索到的同一基因的不同氨基酸序列進(jìn)行多序列比對(duì),采用局部比對(duì)程序如BLOCK,也可選工具Clustal W,也可在線分析www.ebi.ac.uk/clustalw. 其結(jié)果如下圖所示,所有序列的共有部分將會(huì)顯示出來。“*”表示保守,“:”表示次保守。
3. 確定合適的保守區(qū)域。
設(shè)計(jì)簡(jiǎn)并引物至少需要上下游各有一個(gè)保守區(qū)域,且兩個(gè)保守區(qū)域相距50~400個(gè)氨基酸為宜,使得pcr產(chǎn)物在150~1200bp之間,zui重要的是每一個(gè)保守區(qū)域至少有6個(gè)氨基酸,因?yàn)槊織l引物至少18bp左右。
若比對(duì)結(jié)果保守性不是很強(qiáng)很可能找不到6個(gè)氨基酸的保守區(qū)域,這時(shí)可以根據(jù)物種的親緣關(guān)系,選擇親緣相近的物種進(jìn)行二次比對(duì),若保守性仍達(dá)不到要求,則需進(jìn)行三次比對(duì)??傊烤挂x多少序列來比對(duì),要根據(jù)前一次比對(duì)的結(jié)果反復(fù)調(diào)整。zui終目的就是至少有兩個(gè)6個(gè)氨基酸且兩者間距離合適的保守區(qū)域。
4. 利用軟件設(shè)計(jì)引物。
當(dāng)?shù)玫奖J貐^(qū)域后,就可以利用專業(yè)的軟件來設(shè)計(jì)引物了,如利用pp5進(jìn)行簡(jiǎn)并引物的設(shè)計(jì)。將參與多序列比對(duì)的序列中的任一條導(dǎo)入pp5中,再將其翻譯成核苷酸序列,有密碼子簡(jiǎn)并性,其結(jié)果是有n多條彼此只相差一個(gè)核苷酸的序列群,該群可用一條有簡(jiǎn)并性的核苷酸鏈來表示(其中R=A/G,Y=C/T,M=A/C,K=G/T,S=C/G,W=A/T,H=A/C/T,B=C/G/T,V=A/C/G, D=A/G /T,N=A/C/G/T),該具有簡(jiǎn)并性的核苷酸鏈必然包含上一步中找到的氨基酸保守區(qū)域的對(duì)應(yīng)部分,在pp5中修改參數(shù),令其在兩個(gè)距離合適的保守的nt區(qū)域內(nèi)尋找引物對(duì),總之要保證上下游引物都落在該簡(jiǎn)并鏈的保守區(qū)域內(nèi),結(jié)果會(huì)有數(shù)對(duì),分?jǐn)?shù)越高越好。
使用專門的簡(jiǎn)并引物設(shè)計(jì)方法如:CODEHOP bioinformatics.weizmann.ac.il/blocks/codehop.html
GeneFisher2 bibiserv.techfak.uni-bielefeld.de/genefisher2/
在這里我們特別值得說明的是CODEHOP方法,該方法要求的保守區(qū)較短,而且能有效的降低引物的兼并度,是一種非常有效的方法。該方法主要是通過將簡(jiǎn)并區(qū)放在3′末端,并在5′端設(shè)計(jì)一個(gè)一致性的區(qū)域來降低兼并度。
5. 對(duì)引物的修飾
若得到的引物為:5-NAGSGNGCDTTANCABK-3,則其簡(jiǎn)并度=4×2×4×3×4×3×2=2304,很明顯該條引物的簡(jiǎn)并度太高不利于pcr。我們可以通過用次黃嘌呤代替N(因?yàn)榇吸S嘌呤能很好的和4種堿基配對(duì))和根據(jù)物種密碼子偏好這兩種方法來降低簡(jiǎn)并度。
注意:該方法設(shè)計(jì)出來簡(jiǎn)并引物對(duì),適用于用于比對(duì)的氨基酸序列所屬物種及與這些物種分類地位相同的其他物種。
引物中符號(hào)說明:
A代表A
C 代表C
G代表 G
T 代表T
M 代表A or C
R 代表A or G
W代表 A or T
S代表 C or G
Y代表 C or T
K代表 G or T
V 代表A or C or G
H 代表A or C or T
D代表 A or G or T
B 代表C or G or T
N代表 G or A or T or C
由于引物的簡(jiǎn)并性的問題,所設(shè)計(jì)的引物通常簡(jiǎn)并性過高,導(dǎo)致有效引物利用率降低,PCR產(chǎn)物非特異性增高。
雖然減少簡(jiǎn)并引物長(zhǎng)度可以相對(duì)減少簡(jiǎn)并性,但隨之而來的問題是引物的Tm值過低,有時(shí)不得不設(shè)計(jì)第二對(duì)引物對(duì)PCR產(chǎn)物進(jìn)行二次擴(kuò)增,即巢式PCR,或者需要與Touchdown PCR相結(jié)合使用。
與通常設(shè)計(jì)的簡(jiǎn)并引物不同,利用CodeHop方法設(shè)計(jì)簡(jiǎn)并引物。引物由兩部分組成:引物3’端為根據(jù)4-5個(gè)保守氨基酸設(shè)計(jì)的核心簡(jiǎn)并區(qū)(3’core region),長(zhǎng)度只有11-15個(gè)堿基;引物5’端為非簡(jiǎn)并性?shī)A板結(jié)構(gòu)(5’consensus clamp region)。5’端夾板結(jié)構(gòu)是根據(jù)密碼子偏向性設(shè)計(jì)的一致性序列,它zui大程度的預(yù)測(cè)了保守性氨基酸的編碼序列,其長(zhǎng)度取決于所需的退火溫度。這樣設(shè)計(jì)的優(yōu)點(diǎn)在于既減少了引物的簡(jiǎn)并度,又提高了引物的退火溫度,保障了PCR產(chǎn)物的特異性。標(biāo)準(zhǔn)簡(jiǎn)并PCR在聚合反應(yīng)的晚期,隨著產(chǎn)物的增多,引物的非特異性結(jié)合的現(xiàn)象增多;而CodeHop PCR的晚期,這種現(xiàn)象大為減少。實(shí)驗(yàn)結(jié)果表明,按這種方法設(shè)計(jì)的簡(jiǎn)并引物非特異性擴(kuò)增減少,是一種快捷方便的簡(jiǎn)并引物設(shè)計(jì)方案。