時(shí)間:2022-12-25 20:30:01 | 來源:信息時(shí)代
時(shí)間:2022-12-25 20:30:01 來源:信息時(shí)代
滑動(dòng)窗口 : 數(shù)據(jù)流系統(tǒng)在內(nèi)存中開辟的區(qū)間,該區(qū)間只保存最近一段時(shí)間內(nèi)到達(dá)的數(shù)據(jù)流數(shù)據(jù),并隨著新數(shù)據(jù)到來,窗口不斷向前滑動(dòng),用新數(shù)據(jù)替換舊數(shù)據(jù),以實(shí)時(shí)地支持查詢請(qǐng)求。例如,設(shè)S={…,at-1,at,at+1,…}為一個(gè)數(shù)據(jù)流,T為一個(gè)時(shí)間長(zhǎng)度,t>T是一個(gè)變化的時(shí)刻,t和T具有相同的度量單位,則S的一個(gè)時(shí)間間隔為T的滑動(dòng)窗口可表示為S[t-T:t]。數(shù)據(jù)流系統(tǒng)可以同時(shí)存在多個(gè)數(shù)據(jù)流和多個(gè)滑動(dòng)窗口,同一個(gè)滑動(dòng)窗口可以被多個(gè)不同的連續(xù)查詢共享,同一個(gè)連續(xù)查詢也可能查詢多個(gè)滑動(dòng)窗口中的數(shù)據(jù)。
傳統(tǒng)數(shù)據(jù)庫(kù)中的數(shù)據(jù)是靜態(tài)有界的,所以各種查詢操作可以處理全部數(shù)據(jù),而數(shù)據(jù)流通常具有動(dòng)態(tài)和無界的特性,系統(tǒng)無法一次性處理全部數(shù)據(jù),而某些查詢操作所處理的對(duì)象必須有界,因此,數(shù)據(jù)流上的查詢多為基于窗口的查詢。
數(shù)據(jù)流是無界的,而數(shù)據(jù)流處理的某些操作如連接,只能在數(shù)據(jù)流的有限窗口內(nèi)運(yùn)行。為支持各種不同類型的查詢要求,必須建立多樣化的窗口模型來處理數(shù)據(jù)流中已到達(dá)的和即將到達(dá)的數(shù)據(jù)部分; 同時(shí)要提供靈活的窗口機(jī)制傳遞查詢結(jié)果,使查詢結(jié)果可直接呈現(xiàn)給用戶或由用戶根據(jù)需要取出。窗口是數(shù)據(jù)流有限部分的歷史性快照,從這種意義上可把窗口分為: 基于時(shí)間的滑動(dòng)窗口、基于元組的滑動(dòng)窗口和分區(qū)滑動(dòng)窗口。
基于時(shí)間的滑動(dòng)窗口(time-based sliding windows):數(shù)據(jù)流S的基于時(shí)間的滑動(dòng)窗口實(shí)質(zhì)上是大小變化的窗口,窗口以時(shí)間T為單位,T為數(shù)據(jù)流運(yùn)行時(shí)間的計(jì)算周期。從直觀上來說,基于時(shí)間的滑動(dòng)窗口定義了時(shí)間間隔T上的輸出關(guān)系,從而捕獲到有序數(shù)據(jù)流的最新到達(dá)的元組。輸出關(guān)系可定義為:
R(τ)={S|<S,τ>∈S∧(τ′≤τ)∧(τ′≥max{τ-T,0})}
關(guān)鍵詞:數(shù)據(jù),窗口
客戶&案例
營(yíng)銷資訊
關(guān)于我們
客戶&案例
營(yíng)銷資訊
關(guān)于我們
微信公眾號(hào)
版權(quán)所有? 億企邦 1997-2022 保留一切法律許可權(quán)利。