国产成人精品无码青草_亚洲国产美女精品久久久久∴_欧美人与鲁交大毛片免费_国产果冻豆传媒麻婆精东

18143453325 在線咨詢 在線咨詢
18143453325 在線咨詢
所在位置: 首頁(yè) > 營(yíng)銷資訊 > 信息時(shí)代 > 生物信息數(shù)據(jù)(數(shù)據(jù)庫(kù))

生物信息數(shù)據(jù)(數(shù)據(jù)庫(kù))

時(shí)間:2022-11-09 08:30:01 | 來源:信息時(shí)代

時(shí)間:2022-11-09 08:30:01 來源:信息時(shí)代

    生物信息數(shù)據(jù) : 通過基因組研究獲取的相關(guān)生物分子信息。從信息學(xué)的角度來看,生物分子是生物信息的載體。生物信息學(xué)主要研究?jī)煞N載體,即DNA分子和蛋白質(zhì)分子。生物分子至少攜帶著三種信息,即遺傳信息、與功能相關(guān)的結(jié)構(gòu)信息和進(jìn)化信息。
1.生物信息的特征
首先,生物信息數(shù)據(jù)量大,2004年初,國(guó)際數(shù)據(jù)庫(kù)中記錄的接近3000萬條DNA序列的堿基數(shù)就已經(jīng)超過400億,并且生物信息數(shù)據(jù)量呈指數(shù)增長(zhǎng)。其次,生物信息復(fù)雜,種類繁多,既有生物分子序列信息,又有結(jié)構(gòu)和功能信息; 既有生命本質(zhì)信息,如基因,又有生命表象信息,如基因表達(dá)信息。生物信息另一個(gè)重要的特征是,生物信息之間存在著的聯(lián)系,如基因序列與蛋白質(zhì)序列之間的關(guān)系、生物分子序列與結(jié)構(gòu)之間的關(guān)系、結(jié)構(gòu)與功能之間的關(guān)系等。
生物分子信息具體表現(xiàn)為DNA序列數(shù)據(jù)、蛋白質(zhì)序列數(shù)據(jù)、生物分子結(jié)構(gòu)數(shù)據(jù)、生物分子功能數(shù)據(jù)等。序列數(shù)據(jù)、結(jié)構(gòu)數(shù)據(jù)直觀,功能數(shù)據(jù)多變復(fù)雜。在所有類型的數(shù)據(jù)中,序列是最基本的數(shù)據(jù),而且也是目前最多的數(shù)據(jù)。
2.生物信息的數(shù)據(jù)類型
生物信息的數(shù)據(jù)類型主要有:
(1)序列(sequence):主要包括DNA序列、RNA序列、蛋白質(zhì)序列等。序列一般以文本字符串的形式存儲(chǔ)。目前通常的做法是將序列元數(shù)據(jù)和注釋存儲(chǔ)在關(guān)系數(shù)據(jù)庫(kù)中,而每個(gè)序列的實(shí)際序列數(shù)據(jù)存儲(chǔ)在單獨(dú)的可鏈接文件中。
(2)圖(graph): 包括有向(或無向)圖、嵌套圖、超圖等。這種類型的數(shù)據(jù)包括各種生物通路(代謝通路、信號(hào)通路、基因調(diào)控網(wǎng)絡(luò))、遺傳圖譜(偏序圖,即有向無環(huán)圖)、分類學(xué)數(shù)據(jù)(樹或有向無環(huán)圖)和化學(xué)結(jié)構(gòu)圖等。序列可以視為線性有向圖,多重序列可以描述為偏序圖。
(3)高維數(shù)據(jù)(high-dimensional data): 大部分高維數(shù)據(jù)來自基因表達(dá)的微陣列實(shí)驗(yàn)。這些實(shí)驗(yàn)通常包括成千上萬的基因和成百上千的實(shí)驗(yàn)條件和樣本,因此數(shù)據(jù)集是基因和樣本笛卡兒乘積所產(chǎn)生的高維數(shù)組。
(4)形態(tài)(shapes): 蛋白質(zhì)、配體(ligand)及復(fù)合物(complex)的三維結(jié)構(gòu)。這些數(shù)據(jù)包含形態(tài)信息(如蛋白質(zhì)骨架的球狀和棒狀模型)和諸如電荷、疏水性及其他化學(xué)性質(zhì)的標(biāo)量與矢量場(chǎng)信息。
(5)標(biāo)量和矢量場(chǎng)(scalar and vector fields):包括細(xì)胞體內(nèi)電荷分布、穿過細(xì)胞表面或細(xì)胞內(nèi)的鈣流量、穿過細(xì)胞膜的反應(yīng)物或蛋白質(zhì)流量和藥物臨床反應(yīng)等。
(6)時(shí)間數(shù)據(jù)(temporal data): 在研究生物系統(tǒng)動(dòng)力學(xué)時(shí)各種類型(如標(biāo)題、矢量等)的時(shí)間數(shù)據(jù)也是一種重要的數(shù)據(jù)類型,包括細(xì)胞對(duì)環(huán)境變化的反應(yīng)、通路調(diào)控、基因表達(dá)層動(dòng)力學(xué)、蛋白質(zhì)結(jié)構(gòu)動(dòng)力學(xué)和進(jìn)化生物學(xué)等。
(7)模式(patterns): 主要為DNA、RNA和蛋白質(zhì)序列模式(或模體,motifs)。這些模式通常以正則表達(dá)式或隱馬爾科夫模型(Hidden Markov Models,HMMs)及其他類型的語法表示。此外,還有約束、數(shù)學(xué)和統(tǒng)計(jì)模型及文本(text)等數(shù)據(jù)類型。
3.生物應(yīng)用的數(shù)據(jù)查詢類型
生物應(yīng)用的數(shù)據(jù)查詢類型有:
(1)相似性查詢(similarity query):是分子生物學(xué)中普遍采用的一種查詢,其中最常用的是序列相似性查詢,如BLAST序列相似性查詢。
(2)模式匹配查詢(pattern matching query):也是分子生物學(xué)中常采用的查詢。該查詢要找到一個(gè)序列實(shí)例或匹配一個(gè)特定的模式等。模式用正則表達(dá)式、隱馬爾科夫模型和圖表語法(chart grammar)等來描述。圖模式查詢包括子圖同態(tài)(homomorphism)查詢。模式集(motifs)查詢要求找到匹配特定序列的所有模式。
(3)模式發(fā)現(xiàn)查詢(pattern discovery query): 這類查詢包含模式發(fā)現(xiàn),即數(shù)據(jù)挖掘,還包括檢測(cè)序列、圖、3D結(jié)構(gòu)中頻繁出現(xiàn)的模式。這類查詢?cè)陉P(guān)系集(數(shù)據(jù)庫(kù)文獻(xiàn))和序列(大部分在計(jì)算生物學(xué),有時(shí)在數(shù)據(jù)庫(kù)文獻(xiàn))中應(yīng)用得比較多,也可應(yīng)用在圖中。
(4)計(jì)算查詢(computational query):生物學(xué)研究需要提供比傳統(tǒng)數(shù)據(jù)庫(kù)查詢復(fù)雜得多的數(shù)學(xué)和統(tǒng)計(jì)運(yùn)算。例如,通過計(jì)算某個(gè)數(shù)據(jù)子集的相關(guān)系數(shù)矩陣(correlation matrix)來分析微陣列數(shù)據(jù),相關(guān)系數(shù)矩陣查詢是基因聚類的基礎(chǔ)。

74
73
25
news

版權(quán)所有? 億企邦 1997-2022 保留一切法律許可權(quán)利。

為了最佳展示效果,本站不支持IE9及以下版本的瀏覽器,建議您使用谷歌Chrome瀏覽器。 點(diǎn)擊下載Chrome瀏覽器
關(guān)閉