引物,是指在核苷酸聚合作用起始時,刺激合成的一種具有特定核苷酸序列的大分子。與反應物以氫鍵形式連接,這樣的分子稱為引物。引物通常是人工合成的兩段寡聚核苷酸序列,一個引物與靶區域一端的一條脫氧核糖核酸模板鏈互補,另一個引物與靶區域另一端的另一條DNA模板鏈互補,其功能是作為核苷酸聚合作用的起始點,核酸聚合酶可由其3端開始合成新的核酸鏈。體外人工設計的引物被廣泛用于聚合酶鏈反應、測序和探針合成等。
類型
存在有自然中生物的DNA復制引物(核糖核酸引物)和聚合酶鏈式反應(PCR)中人工合成的引物(通常為DNA引物)。一般所說引物,指DNA引物,以下簡稱引物。
設計內容
引物是人工合成的兩段寡聚核苷酸序列,一個引物與目的基因一端的一條脫氧核糖核酸模板鏈互補,另一個引物與目的基因另一端的另一條DNA模板鏈互補。在PCR(聚合酶鏈式反應)技術中,已知一段目的基因的核苷酸序列,根據這一序列合成引物,利用PCR擴增技術,目的基因DNA受熱變性后解鏈為單鏈,引物與單鏈相應互補序列結合,然后在耐高溫DNA聚合酶作用下進行延伸,如此重復循環,延伸后得到的產物同樣可以和引物結合。
PCR引物設計的目的是找到一對合適的核苷酸片段,使其能有效地擴增模板DNA序列。如前述,引物的優劣直接關系到PCR的特異性與成功與否。對引物的設計不可能有一種包羅萬象的規則確保PCR的成功,但遵循某些原則,則有助于引物的設計。
引物設計有 3 條基本原則:首先引物與模板的序列要緊密互補,其次引物與引物之間避免形成穩定的二聚體或發夾結構,再次引物不能在模板的非目的位點引發脫氧核糖核酸聚合反應(即錯配)。具體實現這 3 條基本原則需要考慮到諸多因素,如引物長度(primer length),產物長度(product length),序列 Tm 值 (melting 溫度),引物與模板形成雙鏈的內部穩定性(internal stability,用 ?G 值反映),形成引物二聚體(primer dimer)及發夾結構(duplexformation and hairpin)的能值,在錯配位點(false priming site)的引發效率,引物及產物的GC 含量(composition),等等。必要時還需對引物進行修飾,如增加限制性內切酶位點,引進突變等。
最佳區域
脫氧核糖核酸序列的保守區是通過物種間相似序列的比較確定的。在NCBI上搜索不同物種的同一基因,通過序列分析軟件(比如DNAman)比對(Alignment),各基因相同的序列就是該基因的保守區。
長度
引物長度(primer length)常用的是18-27 bp,但不應大于38,因為過長會導致其延伸溫度大于74℃,不適于Taq DNA聚合酶進行反應。
GC含量
引物序列的 GC 含量一般為 40-60%,過高或過低都不利于引發反應。上下游引物的 GC含量不能相差太大
Tm值
引物所對應模板位置序列的 Tm 值在 72℃左右可使復性條件最佳。Tm 值的計算有多種方法,如按公式 Tm=4(G+C)+2(A+T),在 Oligo 軟件中使用的是最鄰近法(the nearestneighbor method)
3′端避開密碼子第3位
如擴增編碼區域,引物3′端不要終止于密碼子的第3位,因密碼子的第3位易發生簡并,會影響擴增的特異性與效率。
選擇T
引物3′端錯配時,不同堿基引發效率存在著很大的差異,當末位的堿基為A時,即使在錯配的情況下,也能有引發鏈的合成,而當末位鏈為T時,錯配的引發效率大大降低,G、C錯配的引發效率介于A、T之間,所以3′端最好選擇T。
堿基隨機分布
引物序列在模板內應當沒有相似性較高,尤其是3’端相似性較高的序列,否則容易導致錯誤引發(False priming)。降低引物與模板相似性的一種方法是,引物中四種堿基的分布最好是隨機的,不要有聚嘌呤或聚嘧[mì]的存在。尤其3′端不應超過3個連續的G或C,因為這樣會使引物在GC富集序列區錯誤引發。
自身避免互補
引物自身不應存在互補序列,否則引物自身會折疊成發夾結構(Hairpin)使引物本身復性。這種二級結構會因空間位阻而影響引物與模板的復性結合。引物自身不能有連續4個堿基的互補。
兩引物之間也不應具有互補性,尤其應避免3′ 端的互補重疊以防止引物二聚體(Dimer與Cross dimer)的形成。引物之間不能有連續4個堿基的互補。引物二聚體及發夾結構如果不可避免的話,應盡量使其△G值不要過高(應小于4.5kcal/摩爾,?G 值是指 脫氧核糖核酸 雙鏈形成所需的自由能,該值反映了雙鏈結構內部核苷酸堿基對的相對穩定性),否則易導致產生引物二聚體帶,并且降低引物有效濃度而使PCR 反應不能正常進行。
5′ 端中間G值應較高3′ 端較低
△G值是指DNA雙鏈形成所需的自由能,它反映了雙鏈結構內部堿基對的相對穩定性,△G值越大,則雙鏈越穩定。應當選用5′ 端和中間△G值相對較高,而3′ 端△G值較低(絕對值不超過9)的引物。引物3′ 端的△G 值過高,容易在錯配位點形成雙鏈結構并引發脫氧核糖核酸 聚合反應。(不同位置的△G值可以用Oligo 6軟件進行分析)
5′ 端可以修飾
引物的5′ 端決定著PCR產物的長度,它對擴增特異性影響不大。因此,可以被修飾而不影響擴增的特異性。引物5′ 端修飾包括:加酶切位點;標記維生素H、熒光、地高辛、Eu3+等;引入蛋白質結合DNA序列;引入點突變、插入突變、缺失突變序列;引入啟動子序列等。
引物的延伸是從3′ 端開始的,不能進行任何修飾。3′ 端也不能有形成任何二級結構可能。
單鏈無二級結構
某些引物無效的主要原因是擴增產物單鏈二級結構的影響,選擇擴增片段時最好避開二級結構區域。用有關軟件(比如RNAstructure)可以預測估計mRNA的穩定二級結構,有助于選擇模板。實驗表明,待擴區域自由能(△G°)小于58.6l kJ/摩爾時,擴增往往不能成功。若不能避開這一區域時,用7-deaza-2′-脫氧GTP取代dGTP對擴增的成功是有幫助的。
自由能
?G 值是指 脫氧核糖核酸 雙鏈形成所需的自由能,該值反映了雙鏈結構內部核苷酸堿基對的相對穩定性。應當選用 3’端 ?G 值較低(絕對值不超過 9),而 5’端和中間 ?G 值相對較高的引物。引物的 3’端的 ?G 值過高,容易在錯配位點形成雙鏈結構并引發 DNA 聚合反應。
特異性
引物設計完成以后,應對其進行BLAST檢測,通過比對GENEBANK中已公開的全部物種基因序列,檢查所設計的引物除與目標基因外,是否與其他物種或序列存在相同的序列。若未發現與目標序列外的其他序列存在相同序列,則說明引物特異性較好,可以進行下一步的實驗;若存在相同序列,則引物特異性差,不能使用。
值得一提的是,各種模板的引物設計難度不一。有的模板本身條件比較困難,例如GC含量偏高或偏低,導致找不到各種指標都十分合適的引物;用作克隆目的的PCR,因為產物序列相對固定,引物設計的選擇自由度較低。在這種情況只能退而求其次,盡量去滿足條件。
設計要求
做Real 時間時,用于SYBR Green I法時的一對引物與一般PCR的引物,在引物設計上所要求的參數是不同的。引物設計的要求:
●避免重復堿基,尤其是G.
●Tm=58-60度。
●GC=30-80%.
●3'端最后5個堿基內不能有多于2個的G或C.
●正向引物與探針離得越近越好,但不能重疊。
●PCR擴增產物長度:引物的產物大小不要太大,一般在80-250bp之間都可;80~150 bp最為合適(可以延長至300 bp)。
●引物的退火溫度要高,一般要在60度以上;
要特別注意避免引物二聚體和非特異性擴增的存在。
而且引物設計時應該考慮到引物要有不受基因組脫氧核糖核酸污染影響的能力,即引物應該跨外顯子,最好是引物能跨外顯子的接頭區,這樣可以更有效的不受基因組DNA污染的影響。
做染料法最關鍵的就是尋找到合適的引物和做污染的預防工作。對于引物,你要有從一大堆引物中挑出一兩個能用的引物的思想準備---尋找合適的引物非常不容易。
關于BLAST的作用應該是通過比對,發現你所設計的這個引物,在已經發現并在GENEBANK中公開的全部物種基因序列當中,除了和你的目標基因之外,還有沒有和其他物種或其他序列當中存在相同的序列,如和你的目標序列之外的序列相同的序列,則可能擴出其他序列的產物,那么這個引物的特異性就很差,從而不能用。
設計軟件
■oligo 6
Oligo 6是目前使用最為廣泛的一款引物設計軟件,除了可以簡單快捷地完成各種引物和探針的設計與分析外,還具有很多其他同類軟件所不具有的高級功能:
● 已知一個PCR引物的序列,搜尋和設計另一個引物的序列;
●按照不同的物種對MM子的偏好性設計簡并引物;
● 對環型脫氧核糖核酸片段,設計反向PCR引物;
●設計多重PCR引物;
●為LCR反應設計探針,以檢測某個突變是否出現;
●分析和評價用其他途徑設計的引物是否合理;
●同源序列查找,并根據同源區設計引物;
●增強了的引物/探針搜尋手段。設計引物過程中,可以"Lock"每個參數,如Tm值范圍和引物3’端的穩定性等;
● 以多種形式存儲結果;支持多用戶,每個用戶可保存自己的特殊設置。
■Primer Premier 5.0
Primer Premier 5.0 是一種用來幫助研究人員設計最適合引物的應用軟件利用它的高級引物搜索引物數據庫巢式引物設計引物編輯和分析等功能可以設計出有高效擴增能力的理想引物也可以設計出用于擴增長達50kb以上的PCR產物的引物序列。
該軟件主要由GeneTank 序列編輯,Primer引物設計,Align 序列比較,Enzyme 酶切分析和Motif 基序分析等幾個主要功能板塊組成。
參考資料 >