時(shí)間:2022-10-30 06:30:01 | 來源:信息時(shí)代
時(shí)間:2022-10-30 06:30:01 來源:信息時(shí)代
空間數(shù)據(jù)庫(kù) : 以描述、存儲(chǔ)、查詢和處理空間數(shù)據(jù)為特色的專用數(shù)據(jù)庫(kù),是在傳統(tǒng)數(shù)據(jù)模型的基礎(chǔ)上增加了對(duì)空間數(shù)據(jù)的處理能力,它從數(shù)據(jù)類型、查詢語言、查詢處理和存儲(chǔ)方法諸方面提供了對(duì)空間數(shù)據(jù)處理能力的全面支持(包括空間索引和空間連接等)??臻g數(shù)據(jù)庫(kù)所支持的空間應(yīng)用包括地理信息系統(tǒng)(GIS)、多媒體信息系統(tǒng)和計(jì)算機(jī)輔助設(shè)計(jì)系統(tǒng)(CAD)等。
與傳統(tǒng)數(shù)據(jù)庫(kù)相比,空間數(shù)據(jù)庫(kù)系統(tǒng)具有以下特征: 處理的數(shù)據(jù)量非常龐大; 數(shù)據(jù)類型復(fù)雜;數(shù)據(jù)對(duì)象通常是多維的,因此難以對(duì)其進(jìn)行有效的索引;傳統(tǒng)數(shù)據(jù)庫(kù)的查詢語言無法滿足空間應(yīng)用的需要,因此需要進(jìn)行擴(kuò)展以支持空間查詢; 在空間數(shù)據(jù)上的操作通常比一般數(shù)據(jù)庫(kù)應(yīng)用要耗費(fèi)更多的CPU時(shí)間,因此需要在空間索引的基礎(chǔ)上選擇高效的查詢策略。
推動(dòng)空間數(shù)據(jù)庫(kù)研究的最主要的應(yīng)用是GIS,GIS中的空間數(shù)據(jù)格式多樣,如遙感柵格圖像、空間網(wǎng)絡(luò)數(shù)據(jù)和矢量數(shù)據(jù)等。在GIS等應(yīng)用中,要對(duì)空間數(shù)據(jù)進(jìn)行抽象和表達(dá)。為使數(shù)據(jù)庫(kù)能有效地存儲(chǔ)這些空間數(shù)據(jù),需要研究相應(yīng)的數(shù)據(jù)模型,即空間數(shù)據(jù)模型??臻g數(shù)據(jù)在表達(dá)方式上一般分為矢量表示和柵格表示,這兩種表示分別對(duì)應(yīng)于空間對(duì)象模型和空間場(chǎng)模型。在空間對(duì)象模型中,空間中的事物被抽象為點(diǎn)、線、面這樣的離散的對(duì)象,該模型適用于需要處理具有明確邊界的空間實(shí)體(道路、建筑物等)的情況;而在空間場(chǎng)模型中,空間被抽象為一組場(chǎng)函數(shù),該模型通常用于無明確邊界的連續(xù)空間實(shí)體(氣流、植被)的應(yīng)用中。
在采用空間對(duì)象模型表示空間中的實(shí)體和實(shí)體之間的關(guān)系時(shí),需要對(duì)傳統(tǒng)數(shù)據(jù)庫(kù)的數(shù)據(jù)類型和查詢語言進(jìn)行擴(kuò)展,以有效支持空間對(duì)象的存儲(chǔ)和查詢。通常,支持空間對(duì)象模型的數(shù)據(jù)類型稱為空間數(shù)據(jù)類型,并且可以在對(duì)象關(guān)系數(shù)據(jù)庫(kù)中以用戶定義的抽象數(shù)據(jù)類型來對(duì)其進(jìn)行定義。比較典型的對(duì)象建模方法是開放地理信息系統(tǒng)聯(lián)盟(open GIS consortium,OGC)組織制定的空間對(duì)象模型,它的幾何數(shù)據(jù)模型由空間表示體系所描述的幾何體來表達(dá),并規(guī)定了一個(gè)適用于其子類的空間參照系統(tǒng)。OGC標(biāo)準(zhǔn)中的幾何體分為四個(gè)子類: 點(diǎn)、線、面和幾何體集合。OGC組織通過在SQL3/SQL99中定義空間數(shù)據(jù)類型和操作,制定了空間SQL擴(kuò)展標(biāo)準(zhǔn),以作為操縱和獲取空間數(shù)據(jù)的工具,該標(biāo)準(zhǔn)已經(jīng)被廣泛接受。
由于空間對(duì)象的多維特性,傳統(tǒng)的1維數(shù)據(jù)的索引結(jié)構(gòu)無法支持,空間數(shù)據(jù)庫(kù)中必須有專門的索引才能有效地支持對(duì)空間對(duì)象的檢索??臻g索引就是用于支持高效的空間對(duì)象查詢而專門設(shè)計(jì)的索引結(jié)構(gòu),它能夠加速查詢中的空間選取和空間連接操作,從而提高查詢的性能??臻g索引的基本方法可以分為兩類,一類是將多維空間轉(zhuǎn)化為一維空間,然后采用1維的索引結(jié)構(gòu)(如B-樹)進(jìn)行索引。將多維空間轉(zhuǎn)化為1維空間的方法主要是空間曲線填充方法,如Z-曲線和Hilbert曲線等。另一類是直接為空間屬性創(chuàng)建的專門的索引結(jié)構(gòu),如格網(wǎng)、R-樹索引。
僅僅在空間數(shù)據(jù)上建立空間索引并不能完全解決空間數(shù)據(jù)的查詢效率問題,這是因?yàn)榭臻g數(shù)據(jù)上的操作往往比較復(fù)雜,為了得到最佳的查詢計(jì)劃,傳統(tǒng)數(shù)據(jù)庫(kù)的查詢性能評(píng)估中常常被忽略不計(jì)的CPU計(jì)算代價(jià)在空間數(shù)據(jù)庫(kù)的環(huán)境下則必須與I/O代價(jià)一起考慮??臻g數(shù)據(jù)庫(kù)中的查詢通常采用過濾-精煉兩步策略,即先通過空間索引或空間近似對(duì)象快速過濾出一個(gè)較小的查詢結(jié)果的候選集,然后再對(duì)這個(gè)較小候選集中的對(duì)象執(zhí)行CPU代價(jià)高昂的復(fù)雜空間操作和計(jì)算,得到最終的精確結(jié)果集合。
以空間場(chǎng)模型表示空間實(shí)體時(shí),這類空間數(shù)據(jù)庫(kù)被稱為空間柵格數(shù)據(jù)庫(kù)。由場(chǎng)函數(shù)來描述的空間實(shí)體通常采用數(shù)據(jù)分片的方法進(jìn)行存儲(chǔ),其查詢性能主要取決于結(jié)果集的大小以及結(jié)果集在磁盤頁面上的聚集程度??臻g柵格數(shù)據(jù)庫(kù)中的圖像分析操作基于地圖代數(shù),地圖代數(shù)是對(duì)柵格分析所做的大量操作順序進(jìn)行組織的一種系統(tǒng)框架。另一種重要的圖像查詢是基于內(nèi)容的檢索,這種查詢的結(jié)果取決于隱含在柵格圖像中的內(nèi)容和關(guān)系,而不再是顯式存儲(chǔ)在數(shù)據(jù)庫(kù)中的屬性(如元數(shù)據(jù))。
另一類特殊的空間對(duì)象是空間網(wǎng)絡(luò),它在交通、運(yùn)輸、水系以及管網(wǎng)線網(wǎng)等領(lǐng)域應(yīng)用很多。在這類應(yīng)用中,起關(guān)鍵作用的是網(wǎng)絡(luò)連通性關(guān)系??臻g網(wǎng)絡(luò)數(shù)據(jù)庫(kù)就是專門用于解決基于連通性的空間實(shí)體的高效存儲(chǔ)和查詢問題的空間數(shù)據(jù)庫(kù)??臻g網(wǎng)絡(luò)對(duì)象通常采用圖結(jié)構(gòu)進(jìn)行建模,用鄰接表或鄰接矩陣的結(jié)構(gòu)進(jìn)行存儲(chǔ)??臻g網(wǎng)絡(luò)數(shù)據(jù)庫(kù)中常見的查詢包括點(diǎn)查詢、邊查詢和路徑查詢。
從主要數(shù)據(jù)庫(kù)廠商的觀點(diǎn)來看,管理空間數(shù)據(jù)需要專門的產(chǎn)品。因此,他們?cè)谑袌?chǎng)上推出了各類基于商業(yè)數(shù)據(jù)庫(kù)的空間插件產(chǎn)品,其中代表性的產(chǎn)品是Oracle公司的Oracle Spatial和IBM公司的DB2Spatial Extender。使用這類產(chǎn)品能夠很容易地在傳統(tǒng)數(shù)據(jù)庫(kù)應(yīng)用中增加空間處理能力,實(shí)現(xiàn)空間數(shù)據(jù)與其他數(shù)據(jù)的無縫集成。不過這些空間插件通常只能用于廠商自己的數(shù)據(jù)庫(kù)產(chǎn)品,它們對(duì)空間基本分析等功能的支持有限。針對(duì)這樣的問題,一些GIS廠商也為關(guān)注于空間分析的用戶設(shè)計(jì)了專用的數(shù)據(jù)庫(kù)。后者將商業(yè)數(shù)據(jù)庫(kù)作為底層的存儲(chǔ)支持,而把空間領(lǐng)域知識(shí)封裝于其中,對(duì)外提供空間數(shù)據(jù)的訪問,相當(dāng)于一個(gè)中間件。其中代表性的是ESRI公司的空間數(shù)據(jù)庫(kù)引擎ArcSDE。這類產(chǎn)品更貼近GIS應(yīng)用,能夠直接適用于各類商業(yè)數(shù)據(jù)庫(kù),而空間數(shù)據(jù)庫(kù)中的一致性和安全性要求則由產(chǎn)品自身來維護(hù)。近年來,由于MySQL、PostgreSQL等開源數(shù)據(jù)庫(kù)系統(tǒng)得到了廣泛的關(guān)注,針對(duì)空間應(yīng)用特點(diǎn),基于開源數(shù)據(jù)庫(kù)提供靈活的原生空間數(shù)據(jù)支持能力就變得可能。這類數(shù)據(jù)庫(kù)兼具性能高效和擴(kuò)展靈活兩大優(yōu)勢(shì),正成為空間數(shù)據(jù)庫(kù)發(fā)展的新趨勢(shì),其代表性產(chǎn)品是遵循OGC規(guī)范的PostGIS。
上述空間數(shù)據(jù)庫(kù)的技術(shù)主要是解決各類空間實(shí)體的高效存儲(chǔ)和查詢問題,隨著空間數(shù)據(jù)庫(kù)的應(yīng)用普及,有力地推動(dòng)了在更廣泛領(lǐng)域中集成空間信息。這些應(yīng)用領(lǐng)域不僅關(guān)注于空間信息的存儲(chǔ)和查詢,它們開始更多地提出對(duì)知識(shí)發(fā)現(xiàn)和決策支持的需求,因此相關(guān)的方法得以研究開展,出現(xiàn)了支持這類應(yīng)用要求的空間數(shù)據(jù)庫(kù)研究——空間數(shù)據(jù)倉(cāng)庫(kù)和空間數(shù)據(jù)挖掘??臻g數(shù)據(jù)的數(shù)量不斷增長(zhǎng),其中蘊(yùn)涵著許多有用的空間關(guān)系和知識(shí),能夠用來幫助我們理解空間數(shù)據(jù),揭示空間關(guān)系,提供決策支持。研究在空間數(shù)據(jù)庫(kù)中進(jìn)行自動(dòng)和半自動(dòng)地?cái)?shù)據(jù)分析和知識(shí)發(fā)現(xiàn)具有重要意義,空間數(shù)據(jù)挖掘和空間數(shù)據(jù)倉(cāng)庫(kù)就是用于對(duì)空間數(shù)據(jù)庫(kù)中的空間實(shí)體進(jìn)行統(tǒng)計(jì)分析和知識(shí)挖掘的工具。空間數(shù)據(jù)挖掘發(fā)現(xiàn)的知識(shí)類型包括通用的幾何知識(shí)、空間分布規(guī)律、空間關(guān)聯(lián)規(guī)則、空間分類規(guī)則、空間聚類規(guī)則、空間特征規(guī)則、空間劃分規(guī)則以及空間演變規(guī)則等; 空間數(shù)據(jù)倉(cāng)庫(kù)則主要設(shè)計(jì)用于高效支持包含空間數(shù)據(jù)的統(tǒng)計(jì)聚集匯總查詢,提供多層次多角度多粒度的數(shù)據(jù)展現(xiàn)和探查方法,便于分析人員探索性地發(fā)現(xiàn)空間關(guān)聯(lián)和知識(shí)。
客戶&案例
營(yíng)銷資訊
關(guān)于我們
客戶&案例
營(yíng)銷資訊
關(guān)于我們
微信公眾號(hào)
版權(quán)所有? 億企邦 1997-2022 保留一切法律許可權(quán)利。