本發明專利技術提出了一種基于非對稱加密的文本零知識水印檢測方法,包括文本特征提取算法、水印產生算法、水印嵌入方法和零知識水印檢測協議四個部分。本發明專利技術改進的文本特征提取算法提取的文本特征經混沌映射函數產生的水印信息與原始文本具有很大的相關性,便于水印信息的檢測,可以有效防止偽造水印攻擊。另外,利用非對稱加密算法對乘法具有同態性的原理,用來驗證證明者和驗證者之間傳遞數據的正確性,而又不用透露該數據的具體信息,保證了傳遞數據的安全,使得驗證者在驗證水印過程中所掌握的有關水印信息的知識為零。本發明專利技術為文本內容認證與版權保護提供了新的關鍵技術。
【技術實現步驟摘要】
本專利技術涉及針對文本文檔進行版權保護的信息安全領域,尤指。
技術介紹
數字水印技術的應用范圍越來越廣,尤其是在版權保護和泄密追蹤方面的應用越來越多,數字水印技術的研究不應該只關注它的魯棒性、隱蔽性和嵌入容量,更應該關注它的安全性。傳統的水印檢測檢測方法,檢測時檢測者或驗證者必須出示密鑰才能檢測水印,這很可能導致與水印相關信息的泄露,欺騙的驗證者會利用這些信息來攻擊水印。因此數字水印安全性的問題就顯得非常重要。數字水印的安全性不能完全依賴于算法本身。密碼學中的零知識證明思想可以為數字水印的安全性提供重要的技術保障。 零知識水印檢測技術是把密碼學上的零知識證明與數字水印技術結合起來,在對數字水印檢測的同時而不泄露水印的相關信息,使得攻擊者難以利用水印檢測時的信息來修改、偽造或移去水印,進而提高水印的安全性。零知識水印檢測協議由密鑰生成、水印生成、水印嵌入、水印檢測這4種算法構成。密鑰生成算法生成一對水印的嵌入和檢測密鑰。水印生成算法生成滿足一定性質的水印數據。水印嵌入算法在水印嵌入密鑰的控制下,將水印嵌入隱藏到數字載體中。水印檢測算法在水印檢測密鑰的控制下,檢測水印是否存在。 本專利技術涉及水印生成算法,文本特征的特征詞條作為水印生成算法的輸入參數。文本特征提取方法,采用基于特征權值的方法提取特征詞條。傳統文本特征提取方法采用TFIDF文本權值衡量方法,主要用于特征權值的計算。TFIDF方法特征權值可以用詞條的頻率乘以逆文檔頻率來表示,即Wik=TFXIDF 其中,TF表示詞頻,即該詞條在某一文本中的頻率,能夠表示某一個文檔的能力;IDF表示反文檔頻率,能夠表示某一類文檔的區分能力。然而TFIDF方法存在一定的問題,即TFIDF算法沒有有效的反映詞條t在不同類別中出現的頻率情況,進而不能有效的反映該詞條的類與類的區分能力。因此必須要有一個新的權值來衡量詞條出現頻率最高的前兩個類別中的文檔數之差。這個差值越大,說明該詞條t越能夠代表出現頻率最高的類別的特征。水印信息生成后,需要借助于一定的文本數字水印方法把該水印嵌入文本中。目前文本水印嵌入方法有很多種,但嵌入的水印對魯棒性、抵抗格式攻擊和統計攻擊能力都有缺陷,需要一種新的水印嵌入方法,以提高水印的隱蔽性、魯棒性和嵌入容量。由于傳統的水印算法在檢測時,檢測者或驗證者必須出示密鑰才能檢測水印,這很可能導致與水印相關信息的泄露,欺騙的驗證者會利用這些信息來攻擊水印;并且現有的針對圖像的零知識水印檢測方案也會泄漏相關值,所以不是零知識的,不適合作為版權證明方案。
技術實現思路
本專利技術提出,在水印檢測時不暴露任何有關水印的信息且能夠檢測出水印信息來,解決數字水印技術一直存在的安全性較低的問題。為解決以上技術問題,本專利技術采用如下技術方案 ,所述方法包括文本特征提取算法、水印產生算法、水印嵌入方法和基于非對稱加密的零知識水印檢測協議四個部分,所述方法利用改進的文本特征提取算法得到具有魯棒性的文本特征Lw ;LW與作者版權信息A —起進行數字化表示,利用水印產生算法得到水印信息W ;水印嵌入算法把W嵌入到原始文本D 中;檢測、驗證時采用基于非對稱加密的文本零知識水印檢測協議。 所述文本特征提取算法,文本特征提取算法利用改進的特征加權方法計算特征權值,其公式為 W,ik=TFXIDFXCd ^ _ (E1-E2) — Il 其中,η表示包含詞條t的文檔數,其中整個文檔庫中包含詞條t的文檔數最多的一類為E1,包含詞條t的文檔數第二多的一類為E2 ;TF表示詞頻,即該詞條在某一文本中的頻率,能夠表示某一個文檔的能力;IDF表示反文檔頻率,能夠表示某一類文檔的區分能力;(E1-E2)表示包含詞條t文檔數最多的類別與包含詞條t文檔數第二多的類別之差。Cd越大,表示這個加權的結果值就大,因而該詞條就能很好的代表包含t最多的文檔數的類的特征,也就是說詞條t的類別特征表達能力越強。利用改進后的公式能夠從文本中提取出更能代表文本特征詞條出來,即魯棒特征詞條Lw。 水印廣生算法 把作者版權信息A和提取的文本魯棒特征Lw進行數字化表示,然后利用水印產生算法產生水印信息W,步驟如下 (O利用ASCII編碼對提取的魯棒特征Lw和作者版權信息A = {time, author. . . }進行數字化,生成D=^1DyDi...); (2)利用logistic混沛映射函數生成混沛序列S=IS1S2.. . Si. . . }, logistic混沛映射函數的初值為D= (D1D2. . . Di. . . },參數為μ ; (3)利用定義的閾值T產生混沌序列SHS1S2.. . Si. . . }的二值化序列W=Iff1W2... Wi...},其中 Wi e ,即水印信息。 水印嵌入算法采用聯合文本格式和同義詞替換的數字水印算法,在原始文本文檔的不同地方不同層次嵌入多重水印信息。 基于非對稱加密的零知識水印檢測協議所述檢測協議步驟如下 定義W :水印信號,D :載體文本,Dw:水印載體,Lw:文本特征。 驗證者和證明者之間執行下面的協議 (4)證明者產生一個隨機數R,然后根據非對稱加密函數H計算H(R,W)和H(R,Lw),并且把H (R, W)、H (R, Lw)發送給驗證者;(5)驗證者根據擲硬幣規則選擇b=0或1,并把b的值發送給證明者; (6)如果b=0,證明者公開非對稱加密函數H和隨機數R,驗證者根據公開的非對稱加密函數H和隨機數R計算H(R,Dw),然后根據用:足之)^用足AJ是否成立來驗證H(R,Lw)的值是否正確,如果不正確則停止協議; 如果b=l,證明者把(WXLw)發送給驗證者;驗證者根據非對稱加密算法對乘法具有同態性的原理,即H(R,Lw) XH(R, ff) =H(R1WXLw)來驗證(WXLw)是否正確,如果不正確則停止協議;如果正確,則驗證者根據線性相關來計算Γ = -W,如果Τ> ε,ε為閾值,則說明水 η印信息W和Lw相關,即檢測出了水印信息; (7)根據需要的置信度選擇迭代次數k,證明者和驗證者重復k次執行(4)到(6),如果每次的檢驗都通過,驗證者就相信證明者的聲明,認為Dw中確實存在證明者的版權水印,如·果任何一次檢驗失敗,則驗證者不接受證明者的證明,認為證明者是一個欺騙者。本專利技術的有益效果 (1)利用改進的文本特征提取算法提取的文本特征降低了對特征維數的敏感度,能夠有效的提取出具有魯棒性的文本特征來,該特征能夠有效的區別于其他類別的文本; (2)經混沌映射函數產生的水印信息與原始文本具有很大的相關性,這便于水印信息的檢測,可以有效防止偽造水印等攻擊; (3 )采用聯合文本格式和同義詞替換的數字水印算法,在原始文本文檔的不同地方不同層次嵌入多重水印信息,嵌入的水印具有較強的隱蔽性、魯棒性和嵌入容量,且能夠抵抗格式攻擊、統計攻擊; (4)文本零知識水印檢測方法利用非對稱加密算法對乘法具有同態性的原理,用來驗證證明者和驗證者之間傳遞數據的正確性,而又不用透露該數據的具體信息,保證了傳遞數據的安全,使得驗證者在驗證水印過程中所掌握的有關水印信息的知識為零;一個欺騙的證明者能夠欺騙成功的概率最本文檔來自技高網...
【技術保護點】
一種基于非對稱加密的文本零知識水印檢測方法,所述方法包括文本特征提取算法、水印產生算法、水印嵌入方法和基于非對稱加密的零知識水印檢測協議四個部分,所述方法利用改進的文本特征提取算法得到具有魯棒性的文本特征Lw;Lw與作者版權信息A一起進行數字化表示,利用水印產生算法得到水印信息W;水印嵌入算法把W嵌入到原始文本D中;檢測、驗證時采用基于非對稱加密的文本零知識水印檢測協議。
【技術特征摘要】
【專利技術屬性】
技術研發人員:付章杰,孫星明,
申請(專利權)人:南京信息工程大學,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。