時(shí)間:2022-12-30 02:30:02 | 來源:信息時(shí)代
時(shí)間:2022-12-30 02:30:02 來源:信息時(shí)代
聚集查詢 : 數(shù)據(jù)流查詢語句中含有聚集函數(shù)的查詢。在現(xiàn)實(shí)世界的許多數(shù)據(jù)流應(yīng)用中,如傳感器偵測預(yù)警、網(wǎng)絡(luò)流量分析、股票行情分析、Web事務(wù)日志分析等,查詢往往并不需要精確的查詢每一條記錄,而是需要一些聚集值,因此對于數(shù)據(jù)流查詢來說,聚集查詢是應(yīng)用非常頻繁的一種查詢。與傳統(tǒng)的關(guān)系數(shù)據(jù)庫上的聚集查詢一樣,數(shù)據(jù)流聚集查詢主要由count、sum、ave、max和min等聚集函數(shù)組成。
數(shù)據(jù)流聚集查詢依據(jù)不同的數(shù)據(jù)流應(yīng)用環(huán)境,對精度的要求也有所不同,可能具有不同的近似概率或近似特征。一般地,數(shù)據(jù)流聚集查詢方法主要有兩類:
(1)在線聯(lián)機(jī)查詢處理方法: 由用戶控制計(jì)算結(jié)果的情況,并在前面的計(jì)算結(jié)果的基礎(chǔ)上計(jì)算數(shù)據(jù)流下一時(shí)刻的聚集結(jié)果并與之改進(jìn)。
(2)預(yù)計(jì)算提綱方法: 需在查詢之前建立或存儲查詢大綱,接到聚集查詢時(shí)由查詢大綱直接得出查詢結(jié)果。預(yù)計(jì)算提綱方法需要對查詢大綱進(jìn)行更新維護(hù),這些工作都是基于預(yù)處理方法,在這種情況下,所設(shè)計(jì)的算法應(yīng)能簡要概括出并預(yù)先存儲關(guān)于數(shù)據(jù)流的大綱,并在適當(dāng)?shù)姆秶鷥?nèi)保證查詢大綱的準(zhǔn)確性。該大綱可以存儲在一個(gè)小空間內(nèi),并且能夠用來對用戶查詢提供近似計(jì)算結(jié)果。這里的用戶查詢要求對近似結(jié)果有合理的保證,即保證近似查詢結(jié)果在一定的誤差范圍內(nèi)。
目前國內(nèi)外對于數(shù)據(jù)流上聚集查詢研究主要集中在連續(xù)數(shù)據(jù)流上精確聚集查詢的研究以及基于大綱的聚集查詢算法研究。連續(xù)數(shù)據(jù)流上精確聚集查詢的研究主要是優(yōu)化了連接操作,先得到連接結(jié)果,然后再由連接結(jié)果得出精確聚集值; 基于大綱的聚集查詢算法研究主要有直方圖大綱方法、抽樣大綱方法、Hash方法以及小波方法等。
關(guān)鍵詞:數(shù)據(jù),聚集
客戶&案例
營銷資訊
關(guān)于我們
微信公眾號
版權(quán)所有? 億企邦 1997-2022 保留一切法律許可權(quán)利。