必威电竞|足球世界杯竞猜平台

Clustal
來源:互聯網

Clustal是一款廣泛使用的生物信息學計算機程序,用于多重序列比對。Clustal系列包括多種版本,隨著算法的發展,這些工具的名稱也隨之變化。Clustal工具及其算法在各自類別中都有詳細分析。在側邊欄中列出的操作系統并非所有Clustal工具的完全支持,但Clustal Omega具有最多的操作系統支持。

軟件簡介

Clustal系列軟件是生物信息學中用于多序列比對的重要工具。它可以用來發現特征序列,進行蛋白分類,證明序列間的同源性,幫助預測新序列的二級結構與三級結構,確定PCR引物,以及在分子進化分析方面均有很大幫助。Clustal包括ClustalX和ClustalW(前者是圖形化界面版本,后者是命令界面),是生物信息學常用的多序列比對工具。

Clustal系列軟件的歷史始于1988年,由Des Higgins創建了最初的Clustal程序。隨后,ClustalV、ClustalW、ClustalX、Clustal2和Clustal Omega等版本相繼發布,每個版本都在算法的準確性、效率和用戶界面上進行了改進。Clustal Omega是Clustal家族的最新補充,提供了顯著增長的可擴展性,使數以十萬計的序列能夠在幾個小時內排列,并且支持多處理器使用。此外,從流行的衡量基準角度看,其質量比以前的版本有巨大的改善。

Clustal軟件的所有變體都使用一種漸進構建多序列比對的啟發式方法。這種方法通過整體分析序列,然后利用UPGMA/Neighbor-joining方法生成距離矩陣,從矩陣中的序列得分計算引導樹,然后逐漸根據相似性順序對序列進行比對,從而生成多序列比對。Clustal通過三個主要步驟創建多序列比對:使用漸進比對方法進行成對比對、創建引導樹(或使用用戶定義的樹)、使用引導樹進行多序列比對。

Clustal程序接受多種輸入格式,包括NBRF/PIR、FASTA、EMBL/Swiss-Prot、Clustal、GCC/MSF、GCG9 RSF和GDE。輸出格式可以是以下之一或多個:Clustal、NBRF/PIR、GCG/MSF、PHYLIP、GDE或NEXUS。脫氧核糖核酸/核糖核酸比對和蛋白質比對顯示相同的符號,因此*(星號)符號對兩者都有用,其他一致性符號應在DNA/RNA比對中忽略。

可以調整許多設置以適應不同的情況。主要參數是間隙開啟懲罰和間隙延伸懲罰。ClustalW和ClustalX的第2版,即Clustal2,是這些工具的更新和改進版本,預編譯為多種操作系統,如Linux、Mac OS X和Windows(XP和Vista),設計旨在使網站更有組織和用戶友好,同時更新源代碼到最新版本。

CLUSTALW:命令行接口,使用漸進比對方法,首先對最相似的序列進行比對,然后逐漸對最不相似的序列進行比對,直到創建全局比對。ClustalW是基于矩陣的算法,而T-Coffee和Dialign等工具是基于一致性的。ClustalW具有相當高效的算法,與其他軟件競爭力強。

ClustalX:一個圖形用戶界面,提供了直觀的操作方式,使用戶能夠更容易地進行序列比對和分析。

Clustal Omega:Clustal Omega 是Clustal家族的最新補充。在以前的版本基礎上,它提供了一個顯著增長的可擴展性,使數以十萬計的序列在只有幾個小時內排列。它也將使用多個處理器包含其中。此外,從流行的衡量基準角度,其品質比以前的版本有巨大的改善。

描述Clustal軟件的論文被引用非常多,其中兩篇是有史以來被引用最多的論文之一。該軟件的最新版本適用于Windows、Mac OS和unix/Linux。它也常通過其主頁上的網頁界面或由歐洲生物信息學研究所托管來使用。

發展歷程

Clustal 軟件有許多變體,所有這些變體如下:

名稱由來

初始程序中的引導樹是通過UPGMA聚類 分析成對比對構建的,因此命名為 CLUSTAL。1988 年的前四個版本使用阿拉伯數字(1 至 4),而第五個版本Des Higgins在 1992 年改用羅馬數字 V。1994年和1997年,在接下來的兩個版本中,使用了字母V后面的字母,并使其對應于加權的W和X窗口的X。選擇歐米茄這個名稱是為了標志著與之前名稱的變化。

參考資料 >

生活家百科家居網