必威电竞|足球世界杯竞猜平台

基因組數據庫
來源:互聯網

基因組數據庫(GDB)為人類基因組計劃(HGP)保存和處理基因組圖譜數據。GDB的目標是構建關于人類基因組的百科全書,除了構建基因組圖譜之外,還開發了描述序列水平的基因組內容的方法,包括序列變異和其它對功能和表型的描述。

基本簡介

基因組數據庫是分子生物信息數據庫的重要組成部分。基因組數據庫內容豐富、名目繁多、格式不一,分布在世界各地的信息中心、測序中心、以及和醫學、生物學、農業等有關的研究機構和大學。基因組數據庫的主體是模式生物基因組數據庫,其中最主要的是由世界各國的人類基因組研究中心、測序中心構建的各種人類基因組數據庫。小鼠、河豚魚、擬南芥、水稻、線蟲果蠅、酵母、大腸桿菌等各種模式生物基因組數據庫或基因組信息資源都可以在網上找到。隨著資源基因組計劃的普遍實施,幾十種動物、植物基因組數據庫也紛紛上網,如英國Roslin研究所的ArkDB包括了豬、牛、綿羊、山羊、馬等家畜以及鹿、狗、雞等基因組數據庫,美國、英國、日本等國的基因組中心的斑馬魚羅非魚(Tilapia)、青鳉魚(Medaka)、三文魚(Salmon)等魚類基因組數據庫。英國谷物網絡組織(CropNet)建有玉米、大麥、高粱、白蕓豆農作物以及苜蓿屬(Alfalfa)、牧草(Forage)、玫瑰等基因組數據庫。除了模式生物基因組數據庫外,基因組信息資源還包括染色體、基因突變、遺傳疾病、分類學、比較基因組、基因調控和表達、放射雜交、基因圖譜等各種數據庫。

GDB數據庫

由美國Johns Hopkins大學于1990年建立的GDB是重要的人類基因組數據庫,由加拿大兒童醫院生物信息中心負責管理。

GDB數據庫用表格方式給出基因組結構數據,包括基因單位、PCR位點、細胞遺傳標記、EST、疊連群(Contig)、重復片段等;并可顯示基因組圖譜,其中包括細胞遺傳圖、連鎖圖、放射雜交圖、疊連群圖、轉錄圖等;并給出等位基因等基因多態性數據庫。此外,GDB數據庫還包括了與核酸序列數據庫GenBank和EMBL、遺傳疾病數據庫OMIM、文獻摘要數據庫MedLine等其它網絡信息資源的超文本鏈接。

GDB數據庫是用大型商業軟件Sybase數據庫管理系統開發的,并用Java語言編寫基因圖譜顯示程序,為用戶提供了很好的界面,缺點是傳輸速度受到一定限制。

GDB數據庫是國際合作的成果,其宗旨是為從事基因組研究的生物學家和醫護人員提供人類基因組信息資源。其數據來自于世界各國基因組研究的成果,經過注冊的用戶可以直接向GDB數據庫中添加和編輯數據。

線蟲數據庫

AceDB是線蟲(Caenorhabditis elegans)基因組數據庫。需要說明的是,AceDB既是一個數據庫,又是一個數據庫管理系統。AceDB基于面向對象的程序設計技術,是一個相當靈活和通用的數據庫系統,可用于其它基因組計劃的數據分析。AceDB最初是基于Unix操作系統的X窗口系統,適用于本地計算機系統。AceDB提供很好的圖形界面,用戶能夠從大到整個基因組小到序列的各個層次觀察和分析基因組數據。新開發的WebAce和AceBrowser則是基于網絡瀏覽器。Sanger中心已經將其用于線蟲人類基因組數據庫的瀏覽和搜索。庫內的資源包括限制性圖譜,基因結構信息,質粒圖譜,序列數據,參考文獻等等。

酵母數據庫

酵母基因組數據庫SGD(Cherry et al.,1998)是已經完成基因組全序列測定的啤酒酵母基因組數據庫資源,包括啤酒酵母的分子生物學及遺傳學等大量信息。通過因特網可以訪問該數據庫的全基因組信息資源,包括基因及其產物,一些突變體的表型,以及各種有關的注釋信息。酵母基因組是于1998年完成基因組全序列測定的第一個真核生物基因組,其重要性不言而喻。SGD將各種功能集成在一起,生物學家可通過該數據庫進行序列的同源性搜索,對基因序列進行分析,注冊酵母基因名稱,查看基因組的各類圖譜,顯示蛋白質分子的三維結構,設計能夠有效克隆酵母基因的引物序列等。該數據庫通過方便實用、形象生動的圖形界面為用戶提供酵母基因組的物理圖譜、遺傳圖譜和序列特性圖譜等信息。

TDB數據庫

美國基因組研究所TIGR的TDB數據庫包括脫氧核糖核酸及蛋白質序列、基因表達、細胞功能以及蛋白質家族信息等,并收錄有人、植物、微生物等的分類信息,是一套大型綜合數據庫。此外,該數據庫還包括一個模式生物基因組信息庫,收錄了TIGR世界各地微生物基因組信息,包括致Lyme病螺旋體(B. Burgdorferi)、流感嗜血桿菌(H. Influenzae)、幽門螺桿菌(H. Pylori)和生殖道枝原體屬(M. genitalium)等,以及寄生蟲數據庫(T. brucei P. falciparum),人、鼠、水稻、擬南芥(A. Thaliana)等基因組信息資源,其中有些數據可以由TIGR的FTP站點下載。

核酸數據庫

GenBank核酸序列數據庫涵蓋了從完整基因組到單個基因等序列數據及部分注釋信息,稱一次數據庫。此外,還有些更有針對性的基因組資源,或稱專用數據庫。這些專用數據庫既包括了上述一次數據庫的部分數據,也包括從其它數據庫資源獲得的信息或交叉鏈接。這種專門數據庫主要分為兩大類,一類是模式生物基因組數據庫,另一類則與特殊的測序技術有關。這類數據庫盡管也包含序列數據,但它們的特色主要是為某一特定的模式生物提供一個完整的數據資源,如酵母(Saccharomyces cerevisiae)、線蟲(Caenorhabditis elegans)、果蠅(Drosophila melanogaster)、擬南芥(Arabidopsis thaliana)、螺旋菌(Helicobacter pylori)等。這些數據庫從各個不同層次上搜集整理有關信息,以便對某個模式生物基因組有一個更加完整的了解。

參考資料 >

生活家百科家居網