国产成人精品无码青草_亚洲国产美女精品久久久久∴_欧美人与鲁交大毛片免费_国产果冻豆传媒麻婆精东

18143453325 在線咨詢 在線咨詢
18143453325 在線咨詢
所在位置: 首頁 > 營銷資訊 > 信息時代 > 生物信息數(shù)據(jù)庫(數(shù)據(jù)庫)

生物信息數(shù)據(jù)庫(數(shù)據(jù)庫)

時間:2022-11-09 14:30:02 | 來源:信息時代

時間:2022-11-09 14:30:02 來源:信息時代

    生物信息數(shù)據(jù)庫 : 應(yīng)用信息科學(xué)的技術(shù)與方法收集和管理生物分子數(shù)據(jù)所建立的數(shù)據(jù)庫。目前,國際上已經(jīng)建立起許多生物信息數(shù)據(jù)庫,這些數(shù)據(jù)庫由專門的機構(gòu)建立和維護,負(fù)責(zé)收集、組織、管理和發(fā)布生物分子數(shù)據(jù),并提供數(shù)據(jù)檢索和分析工具。數(shù)據(jù)庫及其相關(guān)的分析軟件是生物信息學(xué)研究和應(yīng)用的重要基礎(chǔ),也是分子生物學(xué)研究必備的工具。
生物信息數(shù)據(jù)庫具有如下特征:
(1)數(shù)據(jù)庫的更新速度不斷加快,數(shù)據(jù)量呈指數(shù)增長趨勢。2003年4月宣告完成的人類基因組計劃測出30億個堿基對(bp)的核苷酸排列順序。
(2)數(shù)據(jù)庫的種類多樣化。生物信息學(xué)各類數(shù)據(jù)庫幾乎覆蓋了生命科學(xué)的各個領(lǐng)域。
(3)數(shù)據(jù)庫的復(fù)雜性增加、層次加深。許多數(shù)據(jù)庫具有相關(guān)的內(nèi)容和信息,數(shù)據(jù)庫之間相互引用,如PDB就與文獻庫、蛋白質(zhì)二級數(shù)據(jù)庫、蛋白質(zhì)結(jié)構(gòu)分類數(shù)據(jù)庫、蛋白折疊庫等十幾種數(shù)據(jù)庫直接交聯(lián)。
(4)數(shù)據(jù)庫的使用已高度計算機化和網(wǎng)絡(luò)化。幾乎所有的數(shù)據(jù)庫都可以在國際互聯(lián)網(wǎng)上訪問,并且公共數(shù)據(jù)庫之間相互鏈接。
(5)面向應(yīng)用。各個數(shù)據(jù)庫服務(wù)器除了提供數(shù)據(jù),還提供許多分析工具。此外,在原始數(shù)據(jù)庫的基礎(chǔ)上還開發(fā)了許多面向特殊應(yīng)用的二級數(shù)據(jù)庫,如蛋白質(zhì)分類數(shù)據(jù)庫、蛋白質(zhì)二級結(jié)構(gòu)數(shù)據(jù)庫等。
1. 生物信息數(shù)據(jù)庫分類
一般而言,生物信息數(shù)據(jù)庫可以分為一次數(shù)據(jù)庫(primary database)和二次數(shù)據(jù)庫(secondary database),如圖1所示。


圖1 生物信息數(shù)據(jù)庫


一次數(shù)據(jù)庫一般由國家或國際組織建立和維護,其數(shù)據(jù)直接來源于實驗獲得的原始數(shù)據(jù),只經(jīng)過簡單的歸類整理和注釋。一次數(shù)據(jù)庫根據(jù)其內(nèi)容,又可分為基因組數(shù)據(jù)庫,核酸和蛋白質(zhì)一級結(jié)構(gòu)序列數(shù)據(jù)庫和生物大分子(主要是蛋白質(zhì))三維空間結(jié)構(gòu)數(shù)據(jù)庫。比較著名的核酸序列數(shù)據(jù)庫有GenBank、EMBL和DDBJ等。蛋白質(zhì)序列數(shù)據(jù)庫有PIR和SWISS-PROT。蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫有PDB等。這些數(shù)據(jù)庫是分子生物信息學(xué)的基本數(shù)據(jù)資源,又稱為基本數(shù)據(jù)庫或初始數(shù)據(jù)庫。
二次數(shù)據(jù)庫是對原始生物信息數(shù)據(jù)進行分析、整理、歸納的結(jié)果,是在一次數(shù)據(jù)庫、實驗數(shù)據(jù)和理論分析的基礎(chǔ)上,針對特定的應(yīng)用目標(biāo)而構(gòu)建的具有特殊生物學(xué)意義和專門用途的數(shù)據(jù)庫,也稱為專業(yè)數(shù)據(jù)庫或?qū)iT數(shù)據(jù)庫。二次數(shù)據(jù)庫種類繁多,如以核酸數(shù)據(jù)庫、蛋白質(zhì)序列數(shù)據(jù)庫、具有特殊功能的蛋白質(zhì)等為基礎(chǔ)構(gòu)建的二次數(shù)據(jù)庫和以三維結(jié)構(gòu)原子坐標(biāo)為基礎(chǔ)構(gòu)建的數(shù)據(jù)庫等。其中與蛋白質(zhì)相關(guān)的二次數(shù)據(jù)庫比較多。
牛津大學(xué)的 《核酸研究》 雜志(Nucleic Acids Research)從2000年開始創(chuàng)建生物信息數(shù)據(jù)庫目錄,詳細介紹了每年最新版本的各種數(shù)據(jù)庫。2006update中共收錄了858個通用和專用數(shù)據(jù)庫以及相關(guān)介紹和訪問網(wǎng)址,并將這些數(shù)據(jù)庫分為14類。法國生物信息研究中心Infobiogen于1997年建立了數(shù)據(jù)庫目錄DBCat,至2006年7月共搜集了511個數(shù)據(jù)庫的名稱、內(nèi)容、數(shù)據(jù)格式、聯(lián)系地址和網(wǎng)址等詳細信息。DBCat本身也是一個具有一定數(shù)據(jù)格式的數(shù)據(jù)庫,它按DNA、RNA、蛋白質(zhì)、遺傳圖譜、結(jié)構(gòu)、文獻等分類,其中大部分?jǐn)?shù)據(jù)庫是可以免費下載的公用數(shù)據(jù)庫。
2.數(shù)據(jù)庫查詢和數(shù)據(jù)庫搜索
生物信息數(shù)據(jù)庫的應(yīng)用可以分為兩個主要方面,即數(shù)據(jù)庫查詢(database query)和數(shù)據(jù)庫搜索(database search)。數(shù)據(jù)庫查詢也稱為數(shù)據(jù)庫檢索,是基于正文的查詢,指對序列、結(jié)構(gòu)以及各種二次數(shù)據(jù)庫中的注釋信息進行關(guān)鍵詞、標(biāo)識符或數(shù)據(jù)特性的匹配查找,將查詢條件以正文的形式提交給查詢系統(tǒng)。數(shù)據(jù)庫搜索是指通過特定的序列相似性比對算法,找出核酸或蛋白質(zhì)序列數(shù)據(jù)庫中與檢測序列有一定程度相似性的序列或者同源序列。在生物信息學(xué)中,數(shù)據(jù)庫搜索是專門針對核酸和蛋白質(zhì)序列數(shù)據(jù)庫而言,其搜索的對象,不是數(shù)據(jù)庫的注釋信息,而是序列信息。常用的數(shù)據(jù)庫搜索工具有FastA和BLAST。
常用的數(shù)據(jù)庫查詢和搜索系統(tǒng)有美國國家生物技術(shù)信息中心NCBI開發(fā)的生物信息數(shù)據(jù)庫檢索系統(tǒng)Entrez和歐洲分子生物學(xué)實驗室EMBL開發(fā)的SRS系統(tǒng)(sequence retrieval system)。

74
73
25
news

版權(quán)所有? 億企邦 1997-2022 保留一切法律許可權(quán)利。

為了最佳展示效果,本站不支持IE9及以下版本的瀏覽器,建議您使用谷歌Chrome瀏覽器。 點擊下載Chrome瀏覽器
關(guān)閉