時間:2022-11-27 12:30:01 | 來源:信息時代
時間:2022-11-27 12:30:01 來源:信息時代
網格數據庫 : 把數據庫技術和網格技術相結合產生的一個新型數據庫,是對現有數據庫的網格化。網格數據庫使網格用戶或其他網格服務可通過網格數據庫服務訪問網格中的各種異構數據庫,從而達到數據資源的高度共享和協同處理,對數據資源的訪問更加透明、高效、可靠,同時使得網格數據處理的能力更強,以滿足虛擬組織的數據處理需求。有兩個原因使得在網格上使用數據庫系統成為必需: 第一是很多網格應用使用了結構化的數據,例如,生命科學研究和地球科學研究,又如在絕大多數的商業(yè)應用中已經部署了數據庫系統; 第二是網格本身也使用很多結構化的數據來實現其運行和管理。
1. 網格數據庫管理系統
網格提供一個平臺,這個平臺支持系統化的身份鑒別和授權、資源發(fā)現、數據傳輸、進程創(chuàng)建和調度及跨異構平臺的動態(tài)綁定。在網格提供的這些功能的基礎上,可以構造一個安全可靠具有自主計算能力的高性能網格數據庫管理系統。網格數據庫管理系統最終將成為網格上的一種重要資源,提供數據管理服務。
在構建網格數據庫管理系統方面,首先應提供一個中間件將數據庫管理系統包裝成為網格服務,以便網格應用存取網格數據庫,而不需要對已有的數據庫管理系統做改動。其次是擴展已有的數據庫管理系統,讓它直接利用網格提供的功能來實現分布式的數據庫和相關的網格服務。
2.數據庫存取與集成
數據庫存取與集成主要研究如何將數據庫運用到網格中,面臨的主要問題包括:
(1)網格建立在服務的基礎上,在網格中存取數據庫必須符合網格的標準,換句話說,數據庫應該成為網格中的一種資源并且提供相應的服務。
(2)數據庫有不同的種類(如面向對象的數據庫、關系數據庫),而且屬于同一種類的數據庫產品在功能和接口上也有很大的不同(如Oracle、DB2),在集成各種數據庫到網格中時必須減少重復勞動,同時又要盡可能保留被集成的數據庫的全部功能。
(3)網格鼓勵數據共享,而數據來自于不同的研究者和組織機構,有著各自的數據庫模式和數據庫設計。因此,提供一個中間件來完成異構數據的集成是很重要的。
(4) 網格中不僅包含結構化的數據,也包含半結構化的數據和無結構的數據。
網格數據庫集成就是使用兩個或多個網格數據庫中的信息,并使用這些信息構建一個更大的數據庫。
有三種網格數據庫集成策略:
(1)虛擬數據庫: 虛擬數據庫是一個聯邦數據庫,它只有一個聯邦模式,所有的用戶都無法覺察到多個獨立的數據庫存在的事實。在構造虛擬數據庫時,需要考慮它的異構透明性、命名透明性、屬主和費用透明性、并行透明性和分布透明性。
(2)定制集成:這種方式是指由應用程序自己完成數據庫集成。例如,在有的科學應用程序中,開發(fā)人員自己找到相關的數據源,然后將集成任務劃分為查詢、要執(zhí)行的程序、中間數據源的構建、顯式的數據傳輸和數據變換,以及存儲結果等。網格數據庫管理系統應該提供對這種集成方式的支持,使之降低成本、減少時間耗費和錯誤的發(fā)生。
(3)增量集成:虛擬數據庫是一個理想目標,定制集成又過于注重細節(jié),增量集成居于兩者之間。在增量集成中,開發(fā)人員無須完成集成的每一個細節(jié),高級的數據存取和集成組件(如OGSA-DAI)可以自動完成一些后期的集成步驟。
3. 支持網格應用
在數據庫領域研究相對比較新的網格應用可以有力地推動數據庫技術的發(fā)展。分布式查詢處理、數據流處理、信息檢索和科學數據分析等都是網格應用。其他的網格應用還有網格數據挖掘、網格計算機集成制造系統、網格數字圖書館等。這些應用給傳統的數據庫技術帶來一些新的問題和挑戰(zhàn)。