PIR和SWISS-PROT是創(chuàng)建最早、使用最為廣泛的兩個(gè)蛋白質(zhì)數(shù)據(jù)庫。1984年,“蛋白質(zhì)信息資源”(protein" />
時(shí)間:2022-12-15 14:30:01 | 來源:信息時(shí)代
時(shí)間:2022-12-15 14:30:01 來源:信息時(shí)代
蛋白質(zhì)序列數(shù)據(jù)庫 : 以氨基酸殘基順序?yàn)榛緝?nèi)容,并附有注釋信息的一種序列數(shù)據(jù)庫。
PIR和SWISS-PROT是創(chuàng)建最早、使用最為廣泛的兩個(gè)蛋白質(zhì)數(shù)據(jù)庫。1984年,“蛋白質(zhì)信息資源”(protein information resource,PIR)計(jì)劃正式啟動(dòng),蛋白質(zhì)序列數(shù)據(jù)庫PIR也因此而誕生。此外還有許多蛋白質(zhì)序列復(fù)合數(shù)據(jù)庫,即把多個(gè)一次數(shù)據(jù)庫的數(shù)據(jù)進(jìn)行合并,這樣,用戶可以不必對(duì)每個(gè)數(shù)據(jù)庫進(jìn)行查詢,而只查詢復(fù)合數(shù)據(jù)庫。除了眾多的一次和復(fù)合數(shù)據(jù)庫外,還有許多蛋白質(zhì)序列二次數(shù)據(jù)庫。用戶在使用蛋白質(zhì)序列數(shù)據(jù)庫時(shí),不能只用其中一個(gè),而必須根據(jù)實(shí)際情況進(jìn)行選擇。目前主要的蛋白質(zhì)序列數(shù)據(jù)庫有: UniProt、Swiss-Prot、NCBI Protein database、Prosite蛋白質(zhì)功能位點(diǎn)數(shù)據(jù)庫和Prints蛋白質(zhì)序列指紋圖譜數(shù)據(jù)庫等。
(1) UniProt國際蛋白質(zhì)資源庫(universal protein resource,http://www.pir.uniprot.org/): 是當(dāng)前最全面的蛋白質(zhì)信息目錄的匯總。基于信息整合及標(biāo)準(zhǔn)統(tǒng)一的需要,Swiss-Prot,TrEMBL,PIR蛋白質(zhì)序列數(shù)據(jù)庫的三大巨頭聯(lián)合成立了UniProt。其中The UniProt Knowledgebase (UniProtKB)提供蛋白質(zhì)序列的廣泛知識(shí),包括功能、分類、交叉索引等; The UniProt Reference Clusters (UniRef)將密切相關(guān)的序列整合進(jìn)一個(gè)記錄,提高搜索速度; The UniProt Archive (UniParc)則是一個(gè)全面的檔案記錄,反映所有蛋白質(zhì)序列研究的歷史。
(2) Swiss-Prot(http://www.expasy.org/sprot): 是一個(gè)注釋蛋白質(zhì)序列的數(shù)據(jù)庫,1986年由歐洲生物學(xué)實(shí)驗(yàn)室(EMBL)和日內(nèi)瓦大學(xué)(瑞士)醫(yī)學(xué)生物化學(xué)系合作建立。目前,Swiss-Prot由瑞士生物信息研究所及歐洲生物信息學(xué)研究所共同維護(hù)。Swiss-Prot提供高質(zhì)量的數(shù)據(jù)注釋信息,包括對(duì)蛋白質(zhì)功能、結(jié)構(gòu)域、翻譯后修飾、突變體等的描述,并保證序列數(shù)據(jù)的非冗余性。
(3) NCBI Protein database(BCNI)美國國家生物技術(shù)信息中心蛋白質(zhì)序列數(shù)據(jù)庫(http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=Protein): NCBI Entrez包括各種來源的蛋白序列,其中有Swissprot、PIR、Protein Research Foundation(蛋白質(zhì)研究獎(jiǎng)勵(lì)會(huì)注: 日文)、PDB(蛋白質(zhì)資料庫)中的蛋白序列數(shù)據(jù),還有從GenBank和RefSeq數(shù)據(jù)庫中已注釋的編碼區(qū)通過計(jì)算機(jī)翻譯出來的蛋白序列。NCBI Protein database的序列記錄都有各類鏈接信息,包括預(yù)先計(jì)算的蛋白BLAST比對(duì)結(jié)果、蛋白質(zhì)結(jié)構(gòu)、蛋白質(zhì)保守結(jié)構(gòu)域、相應(yīng)核苷酸序列、基因組、基因等。
(4) Prosite蛋白質(zhì)功能位點(diǎn)數(shù)據(jù)庫(http://www.expasy.org/prosite/): 是瑞士生物信息學(xué)研究所創(chuàng)建的蛋白模式數(shù)據(jù)庫,可以根據(jù)酶的催化位點(diǎn)、配體結(jié)合位點(diǎn)等位點(diǎn)和蛋白質(zhì)序列模式(Pattern)或序列模體(Motif)信息,快速、可靠地鑒別一個(gè)未知功能的蛋白質(zhì)序列屬于哪一個(gè)蛋白質(zhì)家族。特別是在同源性蛋白變異較大時(shí),未知蛋白與已知功能蛋白質(zhì)的整體序列相似性很低,但由于功能的需要保留了與功能密切相關(guān)的序列模式,這樣就可能通過Prosite的搜索找到隱含的功能序列模體。為提高蛋白同源性檢索的敏感性,Prosite還收錄了用于多序列比對(duì)的(Profile)序列譜,能更敏感地發(fā)現(xiàn)序列之間的相似性。
(5) Prints 蛋白質(zhì)序列指紋圖譜數(shù)據(jù)庫(http://umber.sbs.man.ac.uk/dbbrowser/PRINTS): 是基于單個(gè)序列模式構(gòu)建的數(shù)據(jù)庫。序列分析研究發(fā)現(xiàn),蛋白質(zhì)家族的特性是由幾個(gè)保守的序列模式共同決定,因此倫敦大學(xué)的生物化學(xué)和分子生物學(xué)系聯(lián)合創(chuàng)建了Prints數(shù)據(jù)庫。1999年起該庫改由曼徹斯特大學(xué)生物信息學(xué)教研室維護(hù),目的在于通過收集蛋白家族中所有的序列模式,以提高對(duì)一個(gè)蛋白鑒別的分辨力。
客戶&案例
營銷資訊
關(guān)于我們
微信公眾號(hào)
版權(quán)所有? 億企邦 1997-2022 保留一切法律許可權(quán)利。