時(shí)間:2022-12-16 02:30:01 | 來源:信息時(shí)代
時(shí)間:2022-12-16 02:30:01 來源:信息時(shí)代
代謝通路數(shù)據(jù)庫 : 關(guān)于一個(gè)或多個(gè)不同生物體代謝信息的數(shù)據(jù)庫。代謝通路是細(xì)胞內(nèi)發(fā)生的一系列由酶催化的化學(xué)反應(yīng),每個(gè)通路都可能產(chǎn)生代謝產(chǎn)物或者給其他通路提供反應(yīng)物。在代謝通路的反應(yīng)中起催化作用的酶通常加以標(biāo)注生物信息或者鏈接到序列數(shù)據(jù)庫。目前主要的代謝通路數(shù)據(jù)庫有: ENZYME、KEGG pathway、BioCyc、EcoCyc等。
(1) ENZYME數(shù)據(jù)庫: 是瑞士ExPASy(Expert Protein Analysis System,http://www.expasy.ch/)提供的一個(gè)與酶類命名相關(guān)的數(shù)據(jù)庫,主要是基于國際生物化學(xué)與分子生物學(xué)聯(lián)合會(international union of biochemistry and molecular biology,IUBMB)命名委員會的推薦,所描述的每類酶都提供一個(gè)EC(enzyme commission)編號。酶可能會從EC表中刪除或者重新編號,但舊編號不會分配給新加入的酶。除EC編號外,ENZYME數(shù)據(jù)庫還收錄了酶類的名字、可選用的名字、所催化的生化反應(yīng)方程式、酶類所需要的輔助因子(cofactor),它也提供了與該類酶缺失相關(guān)的疾病和與 SWISS-PROT 及PROSITE的鏈接。ENZYME數(shù)據(jù)庫在制藥學(xué)及生化工程生產(chǎn)中具有重要參考價(jià)值。
(2) KEGG (kyoto encyclopedia of genes and genomes):是日本基因組網(wǎng)絡(luò)服務(wù)(Japanese GenomeNet Service,http://www.genome.ad.jp/)的主要數(shù)據(jù)庫資源。KEGG收錄了已完全測序的許多微生物及部分仍未完全測序的生物基因組及代謝通路等信息,它是一個(gè)系統(tǒng)的分析基因信息、聯(lián)系基因組信息和功能的知識庫。KEGG包含四個(gè)主要數(shù)據(jù)庫:①PATHWAY(分子相互作用網(wǎng)絡(luò),如通路等的計(jì)算機(jī)化知識);②GENES(基因組測序工程產(chǎn)生的基因和蛋白質(zhì)信息);③LIGAND(與生物體相關(guān)的化合物和化學(xué)反應(yīng));④BRITE(用于代謝重建的本體)。KEGG數(shù)據(jù)庫用圖來表示數(shù)據(jù)對象,并且開發(fā)了多種計(jì)算方法來檢測可能與生物功能相關(guān)的圖形特征。KEGG通路數(shù)據(jù)庫(PATHWAY)收集了分子相互作用和反應(yīng)網(wǎng)絡(luò)的信息,包括代謝、遺傳信息處理、環(huán)境信息處理(如信號傳遞)、細(xì)胞過程(cellular processes,如細(xì)胞周期)及人類疾病,所有這些信息都用通路圖來表示。對于代謝通路和調(diào)控通路,KEGG提供了XML版本的通路圖,這些KEGG標(biāo)記語言(KEGG Markup Language,KGML)文件提供了可以用于重建和操作KEGG通路圖的圖形信息。至2006年7月,KEGG已經(jīng)收錄了約四萬個(gè)通路的信息。LIGAND主要由COMPOUND(代謝物和其他化合物信息集)、REACTION(上述化合物的酶促反應(yīng)信息集)和ENZYME(關(guān)于酶命名的信息集)等部分組成。LIGAND數(shù)據(jù)庫是對已經(jīng)完全測序生物體的代謝通路進(jìn)行重建的不可缺少的信息來源。
(3) BioCyc 多種生物體代謝通路數(shù)據(jù)庫(http://biocyc.org/): 由205個(gè)通路/基因組數(shù)據(jù)庫和BioCyc開放式化學(xué)數(shù)據(jù)庫(BioCyc Open Chemical Database,BOCD)組成。除了MetaCyc數(shù)據(jù)庫記錄了多種生物代謝通路外,BioCyc中的每個(gè)通路/基因組數(shù)據(jù)庫(Pathway/Genome Database,PGDB)都描述了單個(gè)生物的基因組和代謝通路。每個(gè)PGDB都包含生物基因組、每個(gè)基因的產(chǎn)物、生物代謝網(wǎng)絡(luò)、生物的遺傳網(wǎng)絡(luò)等內(nèi)容。BioCyc的數(shù)據(jù)庫分為三級(Tier): 第一級數(shù)據(jù)庫經(jīng)過研究人員細(xì)致的復(fù)查,并且持續(xù)不斷地更新,包括EcoCyc、MetaCyc和BOCD。第二級數(shù)據(jù)庫由PathoLogic程序(通路預(yù)測程序)計(jì)算產(chǎn)生,經(jīng)過適當(dāng)?shù)膹?fù)查和更新,共有12個(gè)數(shù)據(jù)庫。第三級數(shù)據(jù)庫也由PathoLogic程序計(jì)算產(chǎn)生,但沒有經(jīng)過復(fù)查和更新,共有191個(gè)數(shù)據(jù)庫。①EcoCyc是關(guān)于細(xì)菌E.col K12基因和代謝的數(shù)據(jù)庫,包含E.col完整的基因組序列、代謝通路和信息傳導(dǎo)通路和轉(zhuǎn)錄調(diào)控等信息,數(shù)據(jù)基于科學(xué)文獻(xiàn)。②MetaCyc是一個(gè)非冗余的以實(shí)驗(yàn)方法闡釋的代謝通路數(shù)據(jù)庫,包含六百多個(gè)不同生物的七百多個(gè)通路。MetaCyc的數(shù)據(jù)通過科學(xué)實(shí)驗(yàn)文獻(xiàn)進(jìn)行維護(hù)更正。③BOCD收集了BioCyc數(shù)據(jù)庫中化合物的數(shù)據(jù),大多數(shù)化合物是作為酶催代謝反應(yīng)的底物(substrate)。
BioCyc提供了一組通路工具軟件,主要由三部分組成:①通路/基因組瀏覽器,支持對PGDB的查詢,可視化和分析; ②通路/基因組編輯器,支持對PGDB的交互式更新和精化;③PathoLogic通路預(yù)測程序,支持自動產(chǎn)生PGDB和生物代謝通路預(yù)測。用戶可以利用BioCyc網(wǎng)站來可視化顯示單個(gè)代謝通路或生物體的整個(gè)代謝圖。
客戶&案例
關(guān)于我們
微信公眾號
版權(quán)所有? 億企邦 1997-2022 保留一切法律許可權(quán)利。