基因組資料庫

基因組資料庫(GDB)為人類基因組計畫(HGP)保存和處理基因組圖譜數據。GDB的目標是構建關於人類基因組的百科全書,除了構建基因組圖譜之外,還開發了描述序列水平的基因組內容的方法,包括序列變異和其它對功能和表型的描述。

基本介紹

簡介,GDB資料庫,線蟲資料庫,酵母資料庫,TDB資料庫,核酸序列資料庫,

簡介

基因組資料庫是分子生物信息資料庫的重要組成部分。基因組資料庫內容豐富、名目繁多、格式不一,分布在世界各地的信息中心、測序中心、以及和醫學、生物學、農業等有關的研究機構和大學。基因組資料庫的主體是模式生物基因組資料庫,其中最主要的是由世界各國的人類基因組研究中心、測序中心構建的各種人類基因組資料庫。小鼠、河豚魚、擬南芥、水稻、線蟲、果蠅、酵母、大腸桿菌等各種模式生物基因組資料庫或基因組信息資源都可以在網上找到。隨著資源基因組計畫的普遍實施,幾十種動物、植物基因組資料庫也紛紛上網,如英國Roslin研究所的ArkDB包括了豬、牛、綿羊、山羊、馬等家畜以及鹿、狗、雞等基因組資料庫,美國、英國、日本等國的基因組中心的斑馬魚、羅非魚(Tilapia)、青鱂魚(Medaka)、鮭魚(Salmon)等魚類基因組資料庫。英國穀物網路組織(CropNet)建有玉米、大麥、高粱、菜豆農作物以及苜蓿(Alfalfa)、牧草(Forage)、玫瑰等基因組資料庫。除了模式生物基因組資料庫外,基因組信息資源還包括染色體、基因突變、遺傳疾病、分類學、比較基因組、基因調控和表達、放射雜交、基因圖譜等各種資料庫。

GDB資料庫

由美國Johns Hopkins大學於1990年建立的GDB是重要的人類基因組資料庫,由加拿大兒童醫院生物信息中心負責管理。
GDB資料庫用表格方式給出基因組結構數據,包括基因單位、PCR位點、細胞遺傳標記、EST、疊連群(Contig)、重複片段等;並可顯示基因組圖譜,其中包括細胞遺傳圖、連鎖圖、放射雜交圖、疊連群圖、轉錄圖等;並給出等位基因等基因多態性資料庫。此外,GDB資料庫還包括了與核酸序列資料庫GenBank和EMBL、遺傳疾病資料庫OMIM、文獻摘要資料庫MedLine等其它網路信息資源的超文本連結。
GDB資料庫是用大型商業軟體Sybase資料庫管理系統開發的,並用Java語言編寫基因圖譜顯示程式,為用戶提供了很好的界面,缺點是傳輸速度受到一定限制。
GDB資料庫是國際合作的成果,其宗旨是為從事基因組研究的生物學家和醫護人員提供人類基因組信息資源。其數據來自於世界各國基因組研究的成果,經過註冊的用戶可以直接向GDB資料庫中添加和編輯數據。

線蟲資料庫

AceDB是線蟲(Caenorhabditis elegans)基因組資料庫。需要說明的是,AceDB既是一個資料庫,又是一個資料庫管理系統。AceDB基於面向對象的程式設計技術,是一個相當靈活和通用的資料庫系統,可用於其它基因組計畫的數據分析。AceDB最初是基於Unix作業系統的X視窗系統,適用於本地計算機系統。AceDB提供很好的圖形界面,用戶能夠從大到整個基因組小到序列的各個層次觀察和分析基因組數據。新開發的WebAce和AceBrowser則是基於網路瀏覽器。Sanger中心已經將其用於線蟲和人類基因組資料庫的瀏覽和搜尋。庫內的資源包括限制性圖譜,基因結構信息,質粒圖譜,序列數據,參考文獻等等。

酵母資料庫

酵母基因組資料庫SGD(Cherry et al.,1998)是已經完成基因組全序列測定的啤酒酵母基因組資料庫資源,包括啤酒酵母的分子生物學及遺傳學等大量信息。通過網際網路可以訪問該資料庫的全基因組信息資源,包括基因及其產物,一些突變體的表型,以及各種有關的注釋信息。酵母基因組是於1998年完成基因組全序列測定的第一個真核生物基因組,其重要性不言而喻。SGD將各種功能集成在一起,生物學家可通過該資料庫進行序列的同源性搜尋,對基因序列進行分析,註冊酵母基因名稱,查看基因組的各類圖譜,顯示蛋白質分子的三維結構,設計能夠有效克隆酵母基因的引物序列等。該資料庫通過方便實用、形象生動的圖形界面為用戶提供酵母基因組的物理圖譜、遺傳圖譜和序列特性圖譜等信息。

TDB資料庫

美國基因組研究所TIGR的TDB資料庫包括DNA及蛋白質序列、基因表達、細胞功能以及蛋白質家族信息等,並收錄有人、植物、微生物等的分類信息,是一套大型綜合資料庫。此外,該資料庫還包括一個模式生物基因組信息庫,收錄了TIGR世界各地微生物基因組信息,包括致Lyme病螺旋體(B. Burgdorferi)、流感嗜血菌(H. Influenzae)、幽門螺桿菌(H. Pylori)和生殖道支原體(M. genitalium)等,以及寄生蟲資料庫(T. brucei P. falciparum),人、鼠、水稻、擬南芥(A. Thaliana)等基因組信息資源,其中有些數據可以由TIGR的FTP站點下載。

核酸序列資料庫

GenBank核酸序列資料庫涵蓋了從完整基因組到單個基因等序列數據及部分注釋信息,稱一次資料庫。此外,還有些更有針對性的基因組資源,或稱專用資料庫。這些專用資料庫既包括了上述一次資料庫的部分數據,也包括從其它資料庫資源獲得的信息或交叉連結。這種專門資料庫主要分為兩大類,一類是模式生物基因組資料庫,另一類則與特殊的測序技術有關。這類資料庫儘管也包含序列數據,但它們的特色主要是為某一特定的模式生物提供一個完整的數據資源,如酵母(Saccharomyces cerevisiae)、線蟲(Caenorhabditis elegans)、果蠅(Drosophila melanogaster)、擬南芥(Arabidopsis thaliana)、幽門螺桿菌(Helicobacter pylori)等。這些資料庫從各個不同層次上蒐集整理有關信息,以便對某個模式生物全基因組有一個更加完整的了解。

相關詞條

熱門詞條

聯絡我們