在分子生物學中,開放閱讀框(Open Reading Frame, ORF)從起始密碼子開始,是脫氧核糖核酸序列中具有編碼蛋白質潛能,結束于終止密碼子連續的堿基序列。
由于密碼子(codon)讀寫起始位點的不同,DNA序列可能按六種ORF閱讀和翻譯(每條鏈三種,對應三種不同的起始位點)。ORF識別則是確定哪種開放閱讀框對應真正的多肽編碼序列的過程。
在真核生物中,ORF可能跨過外顯子,在mRNA中進行拼接。基因中的ORF包含并位于開始編碼與終止編碼之間,由于一段DNA或核糖核酸序列有多種不同讀取方式,因此可能同時存在許多不同的開放閱讀框架。
詞語釋義
開放閱讀框[open reading frame,ORF] 是結構基因的正常核苷酸序列,從起始密碼子到終止密碼子的閱讀框可編碼完整的多肽鏈,其間不存在使翻譯中斷的終止密碼子。
在mRNA序列中,每三個連續堿基(即三聯“密碼子”)編碼相應的氨基酸。其中有一個起始密碼子AUG和三個終止密碼子UAA,UAG,UGA。核糖體從起始密碼子開始翻譯,沿著mRNA序列合成多肽鏈并不斷延伸,遇到終止密碼子時,多肽鏈的延伸反應終止。由于讀寫位置不同,ORF在兩條鏈上具有六種可能性。
例子
以一段5'-UCUAAAGGUCCA-3'序列為例,此序列共有3種讀取法:
UCU AAA GGU CCA
CUA AAG GUC
UAA AGG UCC
由于UAA為終止密碼子,因此第三種讀取法不具編譯出蛋白質的潛力,故只有前兩者為開放閱讀框架。
軟件介紹
現在有很多找ORF的軟件,包括在線的,如:ORF Finder的功能ORF Finder被用來預測已存在的編碼區的小基因序列。它較早應于序列設計,應用優于長片斷、高質量的匹配。ORF Finder把提交序列分成六個亞區,并對這六個閱讀框分別進行默認,賦予每個亞區一個確定其編碼內容的度量,如果可能將對每一亞區進行進一步分析。每個亞區按照已有的分類結果,被隨機提交給查找它們是否編碼蛋白質的特定測試收集器。最后只有那些具有編碼潛能的重要區域才被報道。除此之外,ORF Finder也可用于大規模的開放式閱讀框尋找,支持對整個基因組的分析。
參考資料 >