數(shù)" />
時(shí)間:2022-11-18 04:30:01 | 來(lái)源:信息時(shí)代
時(shí)間:2022-11-18 04:30:01 來(lái)源:信息時(shí)代
數(shù)據(jù)庫(kù)水印 : 數(shù)據(jù)庫(kù)版權(quán)保護(hù)技術(shù)。是用隱秘的手段將有意義的版權(quán)說明、用戶身份等水印信息嵌入到數(shù)據(jù)庫(kù)中,以保證在必要的時(shí)候鑒別出非法復(fù)制和盜用的數(shù)據(jù)庫(kù),以有效保護(hù)數(shù)據(jù)庫(kù)版權(quán)。
數(shù)據(jù)庫(kù)水印主要面向關(guān)系數(shù)據(jù),即關(guān)系數(shù)據(jù)水印,并非傳統(tǒng)數(shù)字水印技術(shù)在關(guān)系數(shù)據(jù)上的簡(jiǎn)單應(yīng)用,而是數(shù)字水印技術(shù)與關(guān)系數(shù)據(jù)庫(kù)管理系統(tǒng)的緊密結(jié)合,促進(jìn)了水印關(guān)系數(shù)據(jù)庫(kù)系統(tǒng)的出現(xiàn)與發(fā)展。
數(shù)據(jù)庫(kù)水印誕生于21世紀(jì)初。在2002年VLDB會(huì)議上,IBM Almaden研究中心的Rakech Agrawal和Jerry Kiernan將數(shù)字水印技術(shù)首次應(yīng)用于關(guān)系數(shù)據(jù)庫(kù),提出了著名的“比特重置算法”(bit-resetting method),在數(shù)值型關(guān)系數(shù)據(jù)中嵌入了可以證明版權(quán)的水印信息。2003年,Radu Sion等人提出了可以向數(shù)值型關(guān)系數(shù)據(jù)中嵌入水印信息的“分布特征算法”(distribution preserving method)。同年,中國(guó)工程院李德毅院士提出了利用云模型向關(guān)系數(shù)據(jù)庫(kù)中嵌入水印信息的方法。George Mason大學(xué)的Yingjiu Li等人提出了在關(guān)系數(shù)據(jù)沒有主鍵的情況下,通過構(gòu)造虛擬主鍵嵌入水印的方法。隨后,國(guó)內(nèi)的清華大學(xué)、總參六十一所、武漢大學(xué)等都開展了關(guān)系數(shù)據(jù)水印技術(shù)的研究。
水印關(guān)系數(shù)據(jù)庫(kù)技術(shù)包括關(guān)系數(shù)據(jù)庫(kù)水印的嵌入與提取算法、攻擊模型、水印算法評(píng)價(jià)及關(guān)系水印技術(shù)應(yīng)用等研究?jī)?nèi)容。
隨著知識(shí)經(jīng)濟(jì)的發(fā)展,關(guān)系數(shù)據(jù)庫(kù)管理系統(tǒng)中沉淀的大量有價(jià)值的關(guān)系數(shù)據(jù)已經(jīng)成為企業(yè)的重要知識(shí)財(cái)富。數(shù)據(jù)外包等新型經(jīng)營(yíng)模式迫切要求這些數(shù)據(jù)與他人共享。水印關(guān)系數(shù)據(jù)庫(kù)技術(shù)不僅提供對(duì)關(guān)系數(shù)據(jù)庫(kù)進(jìn)行有效版權(quán)保護(hù)的手段,而且在信息安全領(lǐng)域占有越來(lái)越重要的作用和地位,業(yè)已成為人們關(guān)注的焦點(diǎn)。
1. 云水印
以云模型為理論基礎(chǔ),關(guān)系數(shù)據(jù)庫(kù)云水印(cloud watermark)技術(shù)的基本思想是利用云發(fā)生器產(chǎn)生云滴(一個(gè)數(shù)值),并將其嵌入到關(guān)系數(shù)據(jù)庫(kù)中。它根據(jù)關(guān)系數(shù)據(jù)庫(kù)的某些數(shù)值型屬性值允許一定誤差的特點(diǎn),給定云發(fā)生器的三個(gè)參數(shù),使得通過基本云發(fā)生器產(chǎn)生一定數(shù)量的水印云滴標(biāo)記落在誤差允許的范圍內(nèi),并將這些云滴嵌入到某些元組的數(shù)值型屬性值上。云水印方法利用了云滴的不確定性和無(wú)序性,一方面保證數(shù)值型屬性值在其誤差范圍以內(nèi),另一方面也不影響該關(guān)系數(shù)據(jù)庫(kù)數(shù)據(jù)的實(shí)際使用,具有較好的實(shí)驗(yàn)效果。
云水印方法包括以下三個(gè)步驟:
(1)云水印的生成:將版權(quán)所有者的信息由正向云發(fā)生器生成水印云滴,產(chǎn)生的單個(gè)水印云滴并沒有實(shí)際意義,但所有水印云滴的組合就可表征特定的水印信息??梢愿鶕?jù)關(guān)系數(shù)據(jù)庫(kù)元組屬性值允許的誤差范圍,生成滿足一定條件的水印云滴。
(2)云水印嵌入:根據(jù)用戶輸入的密鑰和元組主鍵值,決定哪些元組的哪些屬性可以嵌入水印云滴,然后做相應(yīng)的修改。
(3)云水印檢測(cè):首先使用相同的密鑰選擇出應(yīng)該嵌入水印的元組和屬性,然后提取出相應(yīng)的水印云滴,再根據(jù)一維逆向云算法還原這些水印云滴所表征的云的數(shù)字特征,并和原始水印生成的云數(shù)字特征進(jìn)行相似性比較,如果達(dá)到一定相似度則可確定關(guān)系數(shù)據(jù)庫(kù)版權(quán)歸屬。
云水印方法在水印檢測(cè)時(shí)需要原始嵌入的水印信息。如果嵌入的是標(biāo)識(shí)數(shù)據(jù)接收者的水印信息,那么需要逐一檢測(cè)所有可能的水印信息。
2. 隨機(jī)水印
數(shù)據(jù)庫(kù)隨機(jī)水印(random watermark)利用密碼學(xué)中偽隨機(jī)數(shù)發(fā)生器G和密鑰為關(guān)系數(shù)據(jù)添加水印。對(duì)于每個(gè)元組,利用元組主鍵值和密鑰的連接作為G的種子,然后再根據(jù)用戶設(shè)定的“密度參數(shù)”決定所需標(biāo)注的元組。對(duì)于被標(biāo)注的元組再一次判定嵌入水印的屬性列,并根據(jù)應(yīng)用特性修改該屬性值的某個(gè)二進(jìn)制位。與此對(duì)應(yīng)的水印提取算法,通過統(tǒng)計(jì)符合嵌入規(guī)則元組的百分比來(lái)提取關(guān)系數(shù)據(jù)庫(kù)的水印信息。隨機(jī)水印具有嵌入速度快、支持動(dòng)態(tài)添加、魯棒性較強(qiáng)等優(yōu)點(diǎn)。
3. 統(tǒng)計(jì)水印
數(shù)據(jù)庫(kù)統(tǒng)計(jì)水印(statistic watermark)將關(guān)系數(shù)據(jù)集進(jìn)行劃分,利用子集合數(shù)據(jù)分布特性向關(guān)系數(shù)據(jù)中嵌入水印信息。
給定待嵌入水印的關(guān)系數(shù)據(jù)集合S,引入一個(gè)基于秘密排序鍵ks的單向Hash函數(shù)對(duì)標(biāo)準(zhǔn)化后的數(shù)據(jù)的最高有效位進(jìn)行秘密排序。根據(jù)排序結(jié)果將原始數(shù)據(jù)集劃分成若干有序的數(shù)據(jù)子集。將水印比特依次嵌入每個(gè)數(shù)據(jù)子集的實(shí)際分布中。如果每個(gè)子集Si中嵌入一個(gè)比特位,這樣一共可以嵌入|S|/|Si|個(gè)水印比特。
檢測(cè)時(shí),利用相同的參數(shù)可以重現(xiàn)秘密排序從而重新形成各個(gè)子集Si。從給定的數(shù)據(jù)中恢復(fù)所有水印標(biāo)記后,在所有恢復(fù)的水印比特位上用多數(shù)選舉方式進(jìn)行判斷,從而確定最可能的原始水印比特位,即水印信息。
4. 攻擊模式
常見的數(shù)據(jù)庫(kù)水印攻擊模式(attack mode)包括子集選取攻擊、子集增加攻擊、子集刪除攻擊、子集修改攻擊以及子集倒序攻擊等。
子集選取攻擊指攻擊者在不影響使用的前提下僅選取帶有水印的數(shù)據(jù)集中的部分元組構(gòu)成新的關(guān)系數(shù)據(jù)集,以此方式達(dá)到擦除或擾亂水印信息的目的。這種攻擊等同于刪除部分元組的操作(子集刪除攻擊)。
子集增加攻擊是指攻擊者增加一些元組到數(shù)據(jù)庫(kù)元組中,從攻擊者觀點(diǎn)看,增加的元組不會(huì)更改原數(shù)據(jù)庫(kù)中有價(jià)值的屬性,從而希望很難檢測(cè)出水印信息。
子集修改攻擊是指攻擊者通過隨機(jī)修改關(guān)系數(shù)據(jù)中某些元組屬性值的方法來(lái)擦除或干擾嵌入的水印信息。常見的有比特位攻擊和湊整攻擊。比特位攻擊又可分為取反攻擊和隨機(jī)攻擊,即將隨機(jī)選取的某些元組屬性值的某些比特位取反(“1”變“0”或“0”變“1”)或隨機(jī)置成0或1。湊整攻擊指去掉數(shù)值型屬性的最低有效位。
子集倒序攻擊指攻擊者通過調(diào)換部分元組或者是屬性列之間的順序來(lái)達(dá)到擦除或擾亂水印的目的。這種攻擊主要是針對(duì)有意義的水印信息,試圖通過改變?cè)M順序來(lái)破壞水印信息的內(nèi)容。
5. 度量指標(biāo)
數(shù)字水印的用途和關(guān)系數(shù)據(jù)的特點(diǎn)對(duì)關(guān)系數(shù)據(jù)水印技術(shù)提出了如下一些度量指標(biāo)(evaluation metrics):
(1)隱匿性:水印的嵌入不應(yīng)給原始數(shù)據(jù)帶來(lái)可察覺的變化。關(guān)系數(shù)據(jù)的使用者應(yīng)該感覺不到水印的存在,即不因嵌入水印而降低關(guān)系數(shù)據(jù)的可用性。對(duì)于數(shù)值型關(guān)系數(shù)據(jù),最簡(jiǎn)單的可用性約束是數(shù)值的絕對(duì)或相對(duì)變化約束和全局變化約束,如最小均方誤差約束等。
(2)魯棒性:水印信息不會(huì)因?yàn)閷?duì)關(guān)系數(shù)據(jù)的某種改動(dòng)而遭到破壞。例如,對(duì)關(guān)系數(shù)據(jù)正常的數(shù)據(jù)更新(選取、插入、刪除或者更新元組等)和各種以擦除或擾亂水印為目的的惡意攻擊,都不應(yīng)該導(dǎo)致水印和所嵌入的關(guān)系數(shù)據(jù)的分離。換句話說,當(dāng)攻擊者修改的元組數(shù)量足以破壞嵌入水印的時(shí)候,關(guān)系數(shù)據(jù)也會(huì)因修改太多而失去了本身的使用價(jià)值。
(3)盲提取性:水印提取過程中既不需要原始數(shù)據(jù),也不需要原始水印信息的參與,這對(duì)關(guān)系數(shù)據(jù)的水印技術(shù)尤為重要。如果提取過程需要原始數(shù)據(jù),保存規(guī)模較大的關(guān)系數(shù)據(jù)將造成巨大的開銷; 如果需要原始水印,在水印提取出來(lái)之前并不知道嵌入的水印具體是哪個(gè),需要逐一驗(yàn)證。
(4)安全性:水印信息應(yīng)該不會(huì)很容易被攻擊者發(fā)現(xiàn)。學(xué)術(shù)界已經(jīng)達(dá)成共識(shí)——在水印算法公開的情況下,算法本身的安全性依賴于密鑰的使用。只有持有密鑰的人才能夠找到水印信息隱藏的位置。
(5)動(dòng)態(tài)添加特性:關(guān)系數(shù)據(jù)通常面臨頻繁的數(shù)據(jù)更新。如果每次插入、刪除或更新之后都要將水印嵌入算法重新應(yīng)用于整個(gè)關(guān)系數(shù)據(jù)集才能夠保持水印的話,頻繁的水印嵌入將成為巨大的開銷。因此,要求關(guān)系數(shù)據(jù)水印算法具有動(dòng)態(tài)添加特性,即每次對(duì)關(guān)系數(shù)據(jù)的更新操作都不會(huì)影響未更新關(guān)系數(shù)據(jù)中的水印信息,只需將水印嵌入算法應(yīng)用于更新的元組,就可以保持水印信息的一致性。
客戶&案例
營(yíng)銷資訊
關(guān)于我們
客戶&案例
營(yíng)銷資訊
關(guān)于我們
微信公眾號(hào)
版權(quán)所有? 億企邦 1997-2022 保留一切法律許可權(quán)利。