一種基于樹狀自動機的域名匹配方法組成比例

技術編號：13492078 閱讀：90 留言：0更新日期：2016-08-07 04:00

本發明專利技術涉及一種基于樹狀自動機的域名匹配方法。該方法將待匹配域名以及模式子串的每一個分段填充至n字節的整數倍，其中n＝L/8，L為計算機系統的最小運算位寬；然后將模式子串以n字節為單元，構建樹狀自動機；然后將待匹配域名從根節點開始，順序執行樹狀自動機直至完成域名匹配。本發明專利技術在進行匹配運算時以n字節為匹配單元，匹配運算效率遠高于現有的字符串匹配方法，樹狀自動機采用hash值作為表項存儲地址，能夠減少表項所占用的存儲空間，并將hash沖突域限定在本級節點內。本發明專利技術適用于域名的固定前綴匹配，或固定后綴匹配，以及其他具備相同的分層特性字符串的匹配運算。

全部詳細技術資料下載

【技術實現步驟摘要】
一種基于樹狀自動機的域名匹配方法
本專利技術屬于信息技術、域名
，具體涉及一種基于樹狀自動機的域名匹配方法。
技術介紹
隨著互聯網技術的飛速發展，域名的訪問流量也快速增加，隨即要求后臺服務器具備更高的解析能力與安全防護能力。后臺服務器在進行域名服務時，需要對域名進行匹配，如何實現域名的快速匹配便是其中的關鍵問題。現有的匹配方法多為字符串匹配：待匹配域名視為字符串T，并且有n個模式子串P1、P2、…、Pn，在T中尋找是否存在任意一個模式字串。該類算法常見的實現方式為：先將n個模式字串經過運算生成樹狀結構體，字符串T只需沿著樹狀結構體的根節點往下進行順序匹配即可，無需遍歷n個模式字串。現有算法進行的是逐字節匹配，而現代計算機系統的CPU運算位寬已普遍達到64位，因此現有的域名匹配方法效率低下。
技術實現思路
本專利技術目的在于針對上述問題，提供一種更高效的基于樹狀自動機的域名匹配方法。本專利技術采用的技術方案如下：一種基于樹狀自動機的域名匹配方法，其步驟包括：1)將待匹配域名以及模式子串的每一個分段填充至n字節的整數倍，其中n＝L/8，L為計算機系統的最小運算位寬；2)將模式子串以n字節為單元，構建樹狀自動機；3)將待匹配域名從根節點開始，順序執行樹狀自動機直至完成域名匹配。進一步地，步驟1)中若某個分段已經是n字節的整數倍，則該分段無需填充。進一步地，步驟2)所述樹狀自動機由節點表項和出邊表項組成；節點表項存儲節點內的出邊數量，節點采用的hash算法初值，以及下一個節點的基地址；出邊表項的存儲地址由出邊的hash值與節點的基地址相加得到。所述出邊表項包含匹...

【技術保護點】
一種基于樹狀自動機的域名匹配方法，其步驟包括：1)將待匹配域名以及模式子串的每一個分段填充至n字節的整數倍，其中n＝L/8，L為計算機系統的最小運算位寬；2)將模式子串以n字節為單元，構建樹狀自動機；3)將待匹配域名從根節點開始，順序執行樹狀自動機直至完成域名匹配。

【技術特征摘要】
1.一種基于樹狀自動機的域名匹配方法，其步驟包括：1)將待匹配域名的每一個分段以及模式子串的每一個分段填充至n字節的整數倍，其中n＝L/8，L為計算機系統的最小運算位寬；2)將模式子串以n字節為單元，構建樹狀自動機；3)將待匹配域名從根節點開始，順序執行樹狀自動機直至完成域名匹配；具體匹配過程如下：a)初始化節點基地址為0，指向根節點；b)從節點基地址讀取表項，獲得節點內的出邊數量N，hash初值M，下一個節點的基地址；c)將輸入的待匹配域名的字符串進行hash運算，hash初值為M，hash運算結果與N進行取余操做后，與節點基地址相加，得到出邊存儲地址；d)從出邊存儲地址讀取表項，比較輸入字符串與表項中的模式子串：若匹配且出邊為輸出邊，匹配過程完成，匹配成功；若匹配且不為輸出邊，節點基地址指向下一個節點，返回步驟b)；若失配且出邊不存在hash沖突鏈，返回步驟a)；若失配且出邊存在hash沖突鏈，出邊表項地址指向下一個沖突表項，重復執行步驟d)。2.如...

【專利技術屬性】
技術研發人員：李曉東，李洪濤，孫云剛，羅瑤，武麗帥，
申請(專利權)人：中國互聯網絡信息中心，
類型：發明
國別省市：北京;11

全部詳細技術資料下載我是這個專利的主人

相關技術

網友詢問留言已有0條評論

還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

發布您的意見

相關領域技術

電子標識域名不匹配技術