數(shù)據(jù)庫理論(數(shù)據(jù)庫)
時間:2022-11-18 00:30:01 | 來源:信息時代
時間:2022-11-18 00:30:01 來源:信息時代
數(shù)據(jù)庫理論 : 數(shù)據(jù)庫與數(shù)據(jù)庫管理系統(tǒng)的相關(guān)理論和研究。數(shù)據(jù)庫技術(shù)自20世紀(jì)60年代發(fā)展至今經(jīng)歷了多個發(fā)展階段,并且克服了多重困難,取得了輝煌的成果,在這中間數(shù)據(jù)庫理論為它的發(fā)展作出了重大的貢獻(xiàn)。數(shù)據(jù)庫理論在數(shù)據(jù)庫技術(shù)發(fā)展中起著基礎(chǔ)性與指導(dǎo)性作用,特別是在若干個歷史發(fā)展轉(zhuǎn)折點所起作用更為明顯。
(1)在20世紀(jì)70年代初,關(guān)系數(shù)據(jù)庫創(chuàng)立的初期,數(shù)據(jù)庫理論為建立完整的關(guān)系數(shù)據(jù)庫理論并為關(guān)系數(shù)據(jù)庫的實際應(yīng)用做出了貢獻(xiàn),由于關(guān)系數(shù)據(jù)庫有堅實理論的支撐,使其發(fā)展近40年來依然具有強大生命力。
(2)在20世紀(jì)80年代出現(xiàn)的多種數(shù)據(jù)模型為數(shù)據(jù)庫的不同領(lǐng)域應(yīng)用提供了基礎(chǔ),如面向?qū)ο竽P汀⒅^詞模型、語義模型、函數(shù)模型以及NF2模型等。
(3)在20世紀(jì)90年代發(fā)展起來的演繹數(shù)據(jù)庫、知識庫以及面向?qū)ο髷?shù)據(jù)庫系統(tǒng)都有完整的理論體系與理論基礎(chǔ)支持。
(4)在20世紀(jì)末發(fā)展起來的數(shù)據(jù)倉庫OLAP技術(shù)以及數(shù)據(jù)挖掘中,在模型建立、算法求解及優(yōu)化等方面都得益于理論的引導(dǎo)與支持。
(5)近年來,數(shù)據(jù)庫理論在Web數(shù)據(jù)庫發(fā)展、搜索引擎、信息檢索以及新的數(shù)據(jù)模型研究中均發(fā)揮重要作用。
在數(shù)據(jù)庫中理論支持分三個層次,其最基礎(chǔ)層是數(shù)學(xué)理論與算法理論等基礎(chǔ)理論,而中層是適應(yīng)各種不同環(huán)境的數(shù)據(jù)模型,主要是概念模型與邏輯模型,而建立在數(shù)據(jù)模型上的是各種類型的數(shù)據(jù)庫理論,其中最為完善的是建立在關(guān)系模型之上的關(guān)系數(shù)據(jù)庫理論,此外,還有其他相關(guān)的數(shù)據(jù)庫理論,如演繹數(shù)據(jù)庫、知識庫及面向?qū)ο髷?shù)據(jù)庫理論等,這三個層次的關(guān)系可以用圖1表示。
圖1 數(shù)據(jù)庫理論的三個層次
在數(shù)據(jù)庫理論中數(shù)學(xué)的作用是至關(guān)重要的,數(shù)學(xué)作為一種工具在數(shù)據(jù)庫研究中發(fā)揮了基礎(chǔ)性作用,在數(shù)據(jù)庫理論中主要發(fā)揮作用的數(shù)學(xué)分支是離散數(shù)學(xué)與算法理論。它們對數(shù)據(jù)模型的研究與創(chuàng)立起著關(guān)鍵的作用,它們還對各種類型數(shù)據(jù)庫理念的建立起著指導(dǎo)作用。
離散數(shù)學(xué)是以離散型對象作為研究目標(biāo)的數(shù)學(xué)分支,其中使用最多的是其中的集合論(包括關(guān)系、函數(shù)等)、代數(shù)系統(tǒng)(包括群、環(huán)、域及格等)、圖論(包括樹)以及數(shù)理邏輯(包括命題邏輯、一階謂詞邏輯及非經(jīng)典邏輯等)等。
算法理論是研究能行性的數(shù)學(xué)理論,它包括算法求解、可計算性理論以及計算復(fù)雜性理論等內(nèi)容。算法理論對數(shù)據(jù)庫中的算法研究,包括提高存/取速度、節(jié)省存儲空間、方便用戶使用等研究起到重要指導(dǎo)作用。在數(shù)據(jù)庫中的一些重要算法,如查詢優(yōu)化算法、魔集算法以及一些并行算法研究等都是算法理論中的重要研究范例。
此外,在基礎(chǔ)理論中還包括一些基礎(chǔ)性方法,如面向?qū)ο蠓椒ǖ葍?nèi)容。
對數(shù)據(jù)庫中的數(shù)據(jù)模型作研究,建立抽象層次的數(shù)據(jù)模型,特別是其中的概念模型與邏輯模型也是數(shù)據(jù)庫理論的重要貢獻(xiàn),它包括ER模型、擴(kuò)充ER模型、關(guān)系數(shù)據(jù)模型、面向?qū)ο髷?shù)據(jù)模型、對象關(guān)系數(shù)據(jù)模型、函數(shù)數(shù)據(jù)模型、謂詞數(shù)據(jù)模型、NF2數(shù)據(jù)模型、層次數(shù)據(jù)模型及網(wǎng)狀數(shù)據(jù)模型等。
在數(shù)據(jù)模型基礎(chǔ)上所建立起來的數(shù)據(jù)庫系統(tǒng)也需有相應(yīng)的理論支撐,它們包括關(guān)系數(shù)據(jù)庫理論、演繹數(shù)據(jù)庫及知識庫理論、數(shù)據(jù)倉庫及面向?qū)ο髷?shù)據(jù)庫理論等。其理論研究內(nèi)容包括計算模型的研究、算法研究及優(yōu)化研究等。
近年來數(shù)據(jù)庫理論研究逐漸延伸到非傳統(tǒng)領(lǐng)域中,如對新的數(shù)據(jù)模型研究,時態(tài)數(shù)據(jù)模型、時空數(shù)據(jù)模型、模糊數(shù)據(jù)模型研究,對信息安全模型的研究,信息檢索研究與搜索引擎、數(shù)據(jù)挖掘中數(shù)學(xué)模型及相關(guān)算法研究,數(shù)據(jù)庫中并行理論與算法研究等,Web數(shù)據(jù)模型及相關(guān)算法研究以及有關(guān)網(wǎng)格計算的研究,而理論中所涉及的數(shù)學(xué)也逐漸擴(kuò)充,它至少包括如概率論、模糊數(shù)學(xué)、數(shù)論、組合數(shù)學(xué)及petri網(wǎng)等內(nèi)容。
在數(shù)據(jù)模型研究中基礎(chǔ)理論起著關(guān)鍵作用,具體表現(xiàn)在:
(1)在關(guān)系模型中應(yīng)用關(guān)系理論對模型作研究,建立起一套完整的關(guān)系模型數(shù)學(xué)理論,如關(guān)系代數(shù)、關(guān)系演算等。
(2)在謂詞模型中就用數(shù)理邏輯中的一階邏輯理論對模型作研究建立起一套完整的謂詞模型數(shù)學(xué)理論,如DATALOG語言等。
(3)在面向?qū)ο竽P椭袘?yīng)用面向?qū)ο蠓椒▽δP妥餮芯繌亩⑵鹨惶酌嫦驅(qū)ο髷?shù)據(jù)模型體系。
(4)在函數(shù)模型中應(yīng)用函數(shù)理論對模型作研究,從而建立起一套基于函數(shù)的數(shù)據(jù)模型。
(5)應(yīng)用圖論中的樹與二級樹對層次與網(wǎng)狀模型的建立起到了重要的支撐作用。
(6)此外應(yīng)用時態(tài)邏輯、模糊數(shù)學(xué)等理論,建立起了時態(tài)數(shù)據(jù)模型與模糊數(shù)據(jù)模型。
在各種數(shù)據(jù)庫系統(tǒng)研究中,基礎(chǔ)理論也起著重要作用,它們包括:
(1)關(guān)系數(shù)據(jù)庫系統(tǒng)中的規(guī)范化理論及查詢優(yōu)化的研究。
(2)演繹數(shù)據(jù)庫及知識庫中的系統(tǒng)構(gòu)架及推演算法研究。
(3)數(shù)據(jù)倉庫及數(shù)據(jù)挖掘中數(shù)據(jù)抽取及挖掘算法的研究。
(4)數(shù)據(jù)庫安全領(lǐng)域研究中信息安全模型及算法的研究。
數(shù)據(jù)庫理論是數(shù)據(jù)庫學(xué)科發(fā)展的重要方面,對其研究將會有力地促進(jìn)數(shù)據(jù)庫應(yīng)用的發(fā)展,與計算機其他學(xué)科一起共同推進(jìn)計算機科學(xué)與技術(shù)的發(fā)展。