人類孟德爾遺傳在線上系統

線上人類孟德爾遺傳數據系統( On-line Mendelian Inheritance in Man,OMIM)是涵概關於人類遺傳病基因座位等相關信息、和文獻的中心級資料庫。該資料庫的數據內容採用一定的格式以文本形式存貯,總檔案大小約為30M,可以從美國國立生物技術信息中心(NCBI)的ftp伺服器下載所有內容,以供本地研究使用。在查詢使用上,資料庫可以允許使用布爾運算元(boolean operators).以實現固定格式的、比較複雜的查詢。

基本介紹

  • 中文名:人類孟德爾遺傳在線上系統
  • 外文名:On-line  Mendelian  Inheritance in Man
  • 又稱:線上人類孟德爾遺傳數據系統
  • 縮寫:OMIM
  • 涉及學科:信息科學、生物遺傳學
  • 包含:人類遺傳病和基因座位等
線上介紹,功能,線上特點,及時性,全面性,實用性,準確性,查詢方法,簡單查詢,高級查詢,複雜布爾查詢,缺陷,科研中的套用,

線上介紹

線上孟德爾遺傳資料庫是一個權威的,及時更新的有關人類基因與遺傳性狀的綜合性資料庫。此資料庫集中關注於表型與基因型之間的聯繫,收錄了所有孟德爾遺傳性疾病和超過12 000種人類基因的相關信息。
它的前身—人類孟德爾遺傳資料庫(Mendelian Inheritance in Man,MIM)是一個孟德爾遺傳性狀和疾病的目錄,由Johns Hopkins大學的Victor A.McKusick博士在20世紀60年代早期創建。自1966年初版以來,伴隨著醫學遺傳學的迅猛發展,MIM內容急劇擴增,至1998年已出至第12版。一厚再厚的印刷版人類孟德爾遺傳資料庫越來越難以跟上醫學遺傳學發展的步伐,1985年,由美國國家醫學圖書館和Johns H opkins大學的WilliamH.Wetch醫學圖書館合作創建了在線上形式的線上孟德爾遺傳資料庫,並於1995年由NCB工(美國國家生物醫學信息中心)開發成為全球資訊網頁,供全世界的科學家免費瀏覽、查詢和下載匡〕。
OMIM包括所有已知的遺傳病、遺傳決定的性狀及其基因,除了簡略描述各種疾病的臨床特徵、診斷、鑑別診斷、治療與預防外,還提供已知有關致病基因的連鎖關係、染色體定位、組成結構和功能、動物模型等資料,並附有經鎮密篩選的相關參考文獻。
OMIM制定的各種遺傳病、性狀、基因的編號,簡稱OMIM號,為全世界所公認。有關疾病的報導必須冠以OMIM號,以明確所討論的是哪一種遺傳病。
可見OMIM在國際醫學界的權威性。因此,OMIM作為醫學遺傳學最權威的及時更新的百科全書,被譽為醫學遺傳學界的“聖經”。

功能

OMIM是在McKusick博士編撰的《人類孟德爾遺傳》一書的基礎下發展起來的。目前資料庫的整理和注釋任務均由John Hopkins大學醫學院的一部分專職從事於科學寫作和評論的(醫學)博士們承擔,他(她)們都具有良好的遺傳學基礎,以保證數據注釋的質量。
對於臨床工作者,通過體現病人臨床特徵的關鍵字,可以從OMIM資料庫中尋找最近的臨床檢測標準和發展趨勢在教學研究方面, OMIM可以迅速、簡單地提供給學者們關於基因和遺傳病方面最關鍵的信息和綜評,並且實現表型到基因側的分析。而這些是在線上醫學檢索系統( Vledline )無法比擬的。當然OMIM最具魅力之處是它能夠提供給遺傳學家關於基因序列、圖譜、文獻等其它資料庫關於該類注釋的詳盡信息。
因此,這樣的無縫集成能夠提供和讓我們了解疾病基因組領域的前沿性進展和以及該領域活躍的研究工作者。
同時,基於OMIM的知識發現(也就是所謂的數據挖掘,data-mining )也有助於我們掌握生化途徑及疾病的分子致病機理。

線上特點

及時性

線上人類孟德爾遺傳資料庫的內容幾乎每日更新,及時更新是O M IM的基本特點。每一收錄條目的Edithistory都記錄了更新的歷史,使讀者對於每一條目的“新”的程度心中有數。

全面性

OMIM不僅收錄了以孟德爾方式遺傳的所有單基因病的相關資料,而且還收錄了染色體病、多基因病、線粒體病方面的資料,所涵蓋的病種異常豐富。具體到每一條目也即是每一種疾病,OMIM都提供了從基礎到臨床的全方面的信息。基礎方面的信息涵蓋M appmg(基因定位),MolecularGenetics(分子遺傳學)、Pathogenesis(病理機制)、Inheritance(遺傳方式),Anneal Model(動物模型)等,臨床方面的信息則包括clinical feature(臨床特徵),Diagnosis(診斷),Clulical Management(臨床治療方案)等。

實用性

對於每種疾病,OMIM中的文獻經過專家的細緻遴選,文獻數量遠少於Medline,可使科研工作者從浩瀚的文獻中解脫出來,快速掌握某種疾病的遺傳學知識。此外,此資料庫還與其它資料庫建立了廣泛的連結,如通過連結到NCBI的Medline,可直接連結到相關的參考文獻;通過EntrezGene及其子連結Nomenclature, Refseq,G enBank,Protein和UniGene等資料庫獲得疾病相關基因的DNA序列,蛋白質和表達譜等信息;還可通過Linkout連結到Genetic Association Database(遺傳相關性資料庫),獲得人類複雜性疾病或者性狀的基因多態性的相關信息。

準確性

OMIM的編輯均為擁有良好的遺傳學知識背景的PhD或MD,並且一旦遇到涉及某一新遺傳性疾病的論文,只有經過幾位高級臨床醫師的嚴格審查討論後,方可載人OMIM。這樣,保證了OMIM的準確性和權威性。

查詢方法

OMIM的查詢方式有簡單查詢、高級查詢和複雜布爾查詢。

簡單查詢

是OMIM的默認查詢方式,直接在搜尋引擎內填入需要查詢的關鍵字,不必指明搜尋範圍、限制或布爾運算元。例如,我們查詢”與心肌病有關的定位於11號染色體的常染色體顯性遺傳疾病基因”,可以在查詢欄內填入"cardiomyopathy 11 autosomal dominant",得到6條結果(查詢時間 2001/10/12)。

高級查詢

可以通過歷史(history)、索引(index)和限制(limit)三個選單的組合方式實現比較多樣的查詢。歷史選單可以迅速提供先前的查詢結果、支持布爾運算元(AND,OR,NOT)的組合、修改先前的查詢。查詢時,布爾運算元必須為大寫,支持“*”通配符和括弧“()”限制。限制選單的功能包括指定諸如標題,MIM登錄號、參考文獻等查詢範圍,以及染色體位置,登錄號前綴,如#、*等,記錄建立和修改的時間,其它屬性諸如等位變異體和基因圖座位。索引包括有關數語(terms)的字母列表、包含對應術語的記錄檔案數,可以提供和選擇多個術語用於查詢。
這裡,我們採取與簡單查詢同樣的例子,來說明高級查詢的使用方法。第一步,我們在查詢欄內填入“cardiomyopathy" ,’選中“限制選單(limit ) ",選中複選框“Text”和“chromosomes 11",點擊“go"。
第二步,在查詢欄內填人“autosomaldominant",選中“限制選單”,選中查詢範圍(Searchin Fields))複選框內的“clinical synopsis",點擊“go"。第三步,選中“歷史選單(history )" ,敲入上兩步的歷史代碼,如“# 1 AND # 2",得到4條結果。

複雜布爾查詢

這種查詢方式實際上是高級查詢的命令行方式,主要優勢是一步即可完成高級查詢的任務。例如我們前面提到的例子可以改寫為布爾算式cardiomyopathy[txt] AND11 [chrom] AND autosomal dominant[clin]。我們可以看到,所有域限定詞(field qualifiers)均封閉在方括弧內([])。如果沒有指定一個域限制詞,則系統默認為所有領域(All Fields )。限定詞和搜尋詞可以不必用空格格開,但運算元的左右兩端則必須是空格。運算符的演算順序是自左到右,遵循括弧優先原則。

缺陷

OMIM資料庫模式(database schema)和數據模型(data model)不透明,所以無法實現即席查詢(adhoc),也沒有提供相應的查詢界面。也就意味著使用者無法利用SQL查詢語句自行編寫查詢語句進行資料庫的知識發現。對於複雜性疾病,例如哮喘,由於所需分析的數據類型異常複雜,OMIM目前提供的解決方案似乎無法滿足日益增長的研究需要。而且OMIM包含的內容顯然沒有座位專一資料庫(locus一specific database)那樣豐富:突變數據沒有完全收集,缺乏引物設計的信息,基因表達譜等等。數據註解僅限於遺傳學方面。
值得一提的是,中國醫學科學院心血管病研究所生物信息中心正在籌建分子心臟病學資料庫,其主要形式將與OMIM和SwissPro相似,是以文本註解為特徵,採用專家方式對文獻中的數據進行整理,將更多的語義信息以知識表示形式存人系統的一種知識庫(knowledgebase )。我們藉此也希望全國的同道加人到我們的隊伍中來,建立一個具有國際水平的關於心血管疾病方面的生物信息平台,從而推動我國在分子心臟病學領域的研究和協作,以及在世界範圍內該領域的研究互動。

科研中的套用

利用OM IM Statistics了解最新的有關遺傳病、性狀及基因的整體信息
打開OMIM Chttp://www.ncbinlm.mb.gov/om im) ,點擊OMIM Facts下的Statistics,截至2009年7月8日,OMIM收錄的總條目數為19 437個,與人類疾病或性狀相關的序列明確的基因座為13134個(在MIM號前具有“*;號標識),其中具有已知表型的基因座(在MIM號前具有“+”號標識)有374個。分子機制明確的遺傳性狀有2517個,分子機制未知的孟德爾遺傳性狀有1744個(在MIM號前具有“%”號標識);其它可能以孟德爾方式進行遺傳的性狀有2042個。在分子機制未知的孟德爾遺傳性狀中,常染色體遺傳1598個,x連鎖遺傳141個,Y連鎖遺傳5個,線粒體遺傳0個,採用這種方法,教師可不斷獲得最新資料介紹給學生。
利用OMIM資料庫獲取遺傳病最新、最詳細的研究資料
科研工作者、教師和學生藉助於OMIM,可以從浩瀚的文獻堆中解脫出來,快速掌握某一疾病的遺傳學知識。如想了解孟德爾遺傳病血友病B的相關信息,可在OMIM主頁的檢索框中輸入“hem ophiliaB",點擊檢索結果中的#306900條目,即可獲得關於該疾病的多方面信息,包括Descriptaon(基本描述)、Mapping(基因定位),Molecular Genetics(分子遺傳學)、Inheritance(遺傳方為,M appmg(基因定位)、Molecular Genetacs(分子遺傳學)和PopulataonGenetics(群體遺傳學)等。並且每一方面的描述都提供了相應參考文獻的連結,可供進一步查閱。
OMIM也收錄了多種多基因遺傳病,以asthmaCOMIM #600807)為例,OMIM提供了包括Descripton概況),Cfinical Features(臨床特例)、Inheritance(遺傳方式)、P athogenesis(病理) 、Mappmg(易感基因定位),Molecular Genetics(分子遺傳學),AnimalModel(動物模型)等非常全面的信息,使我們可以快速而全面地把握某種疾病的主要信息嘆
利用OMIM資料庫獲得遺傳病診斷、諮詢及治療的資料
OMIM還提供了每種疾病的clinical feature(臨床特徵),Diagnosis(診斷),Cfinical ManagementC臨床治療方案)和Gene Therapy等方面的信息,尤其是其中的clinicalsynopsis(臨床提要)簡明扼要且實用性很強。可以說掌握了OMIM,就猶如擁有了一套遺傳病診斷、治療的專家系統。
利用OMIM的GeneMap和MorbidMap獲取疾病基因定位的詳細資訊
科研人員藉助於OMIM可了解導致特定疾病的特定基因。如在檢索框中輸入疾病的名稱,就可查出該病的基因符號和基因位置信息;輸入基因符號可獲知與該基因相關的疾病信息;輸入染色體區帶號可獲得該區帶定位的基因及相關疾病信息。除此之外,OMIM的不少條目還列出了致病基因的"allelic variants"(等位基因變異型)可供參考巨〕。
目前,遺傳性疾病數目不斷增多,而大多數遺傳病都相對罕見,教學科研工作者、臨床醫師甚至醫學遺傳學專家所熟悉的病例畢竟有限,但是通過活用OMIM資料庫這部及時更新的字典,可望對數以萬計的遺傳病輕車熟駕。OMIM也以其龐大的讀者群證明著自己的價值。統計表明,全世界每日有4 000位讀者查詢OMIM,每天的檢索次數高達22 000。在醫學研究進人分子醫學的今天,OMIM必將對醫學遺傳學的教學科研做出更大貢獻。

相關詞條

熱門詞條

聯絡我們