• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    基于統計模型的社區挖掘方法及系統技術方案

    技術編號:15691099 閱讀:62 留言:0更新日期:2017-06-24 04:01
    本發明專利技術適用于網絡技術領域,提供了一種基于統計模型的社區挖掘方法及裝置,所述方法包括:讀取符號網絡N的鄰接矩陣A,設置社區數K的變化范圍為[K

    Community mining method and system based on statistical model

    The invention is applicable to the field of network technology, provides a method and device for mining communities based on statistical model, the method includes: adjacency matrix A reads the symbol of the network N, changes in the scope of setting up community number K [K

    【技術實現步驟摘要】
    基于統計模型的社區挖掘方法及系統
    本專利技術屬于網絡
    ,尤其涉及一種基于統計模型的社區挖掘方法及系統。
    技術介紹
    與僅能表示個體間是否存在關系的無符號網絡相比,符號網絡能夠將單一的存在關系擴展為正、負關系。比如,社交網絡中的正鏈接表示友好、喜歡、信任等關系,負鏈接表示敵對、不喜歡、不信任等關系;政治網絡中的正鏈接表示政治同盟關系、負鏈接表示政治敵對關系等。這些增加的符號信息有助于更深入地了解網絡背后隱含的規律。社區作為復雜網絡中普遍存在的一類重要結構模式,對于理解網絡/系統的功能及發展演化具有重要的意義。對于社區發現問題,現有技術基于不同的原理提出了大量的社區發現算法。比如基于介數的算法、基于信息論的算法、基于模塊度的算法、基于模型的算法等。然而,這些社區發現算法都是基于無符號網絡提出的,更多地關注鏈接的密度而忽視了鏈接的符號,難以直接應用于帶有正、負鏈接的符號網絡。此外,現有技術還提出了專門用于符號網絡的社區發現算法。比如:基于frustration的算法,通過最小化符號網絡社區內負鏈接與社區間正鏈接的數量之和進行社區劃分;基于改進模塊度(modularity)的算法,對適用于無符號網絡的模塊度函數進行改進使之可以處理網絡鏈接的符號;基于多目標優化的算法,通過同時優化多個目標函數實現對符號網絡的社區發現,等等。然而,上述符號網絡社區發現算法都歸屬于優化算法或啟發算法,其檢測精度依賴于所設計的優化目標函數或啟發策略的質量,社區挖掘的準確度不高。
    技術實現思路
    鑒于此,本專利技術實施例提供了一種基于統計模型的社區挖掘方法及系統,以提高對符號網絡進行社區挖掘的準確度。第一方面,提供了一種基于統計模型的社區挖掘方法,所述社區挖掘方法包括:讀取符號網絡N的鄰接矩陣A,設置社區數K的變化范圍為[Kmin,Kmax],并初始化社區數K=Kmin,其中,所述符號網絡N的節點總數為n,Kmin和Kmax為n范圍內的整數;初始化每一個社區數K對應的統計模型NMK,將所述統計模型NMK與所述符號網絡N擬合,并計算所述統計模型NMK的選擇標準HK;比較所有統計模型NMK的選擇標準HK,選取選擇標準HK最大的統計模型NMK作為最優模型NMoptim;根據所述最優模型NMoptim確定所述符號網絡N中每個節點i所屬的社區,0<i≤n。進一步地,所述初始化每一個社區數K對應的統計模型NMK包括:對于變化范圍[Kmin,Kmax]內的每一個社區數K,構建與所述社區數K對應的統計模型NMK=(n,K,Z,π,Ω);初始化統計模型NMK中的第一參數π對應的近似分布參數η、第二參數Ω對應的近似分布參數ρ以及指示變量Z對應的近似分布參數τ;其中,第一參數π為K×K×3維向量,表示社區間連接概率,所述第一參數π中的每一個元素πlq包括三個分量,且滿足:0<l≤K,0<q≤K,分量πlq1表示第l個社區與第q個社區間節點存在一條正鏈接的概率,分量πlq2表示第l個社區與第q個社區間節點沒有鏈接的概率,分量πlq3表示第l個社區與第q個社區間節點存在一條負鏈接的概率;第二參數Ω為K維向量,表示節點屬于社區的概率,所述第二參數Ω中的每一個元素ωk滿足:0<k≤K;所述指示變量Z為n×K維向量,用于指示每個節點i所屬的社區;該指示變量Z的每一行中只有一個元素zik為1,其余元素zik為0,0<i≤n,0<k≤K。進一步地,所述將所述統計模型NMK與所述符號網絡N擬合,并計算所述統計模型NMK的選擇標準HK包括:A:將當前的統計模型NMK與所述符號網絡N擬合,按照預設計算公式更新所述指示變量Z對應的近似分布參數τ、第一參數π對應的近似分布參數η、第二參數Ω對應的近似分布參數ρ;B:根據更新后的所述指示變量Z對應的近似分布參數τ、第一參數π對應的近似分布參數η、第二參數Ω對應的近似分布參數ρ計算所述統計模型NMK的選擇標準HK,并計算所述選擇標準HK與上一次迭代計算得到的選擇標準HK之間的差值;C:比較所述差值與預設閾值,若所述差值小于所述預設閾值,則以本次更新的所述指示變量Z對應的近似分布參數τ、第一參數π對應的近似分布參數η、第二參數Ω對應的近似分布參數ρ作為所述統計模型NMK的最優參數;否則,返回步驟A進行下一次迭代計算。進一步地,所述選擇標準HK的計算公式為:其中,τik表示指示變量Z中元素zik對應的近似分布參數,ηlqh表示第一參數π中元素πlqh對應的近似分布參數,表示第一參數π中元素πlqh對應的先驗分布參數,ρ表示第二參數Ω中元素ωk對應的近似分布參數,表示第二參數Ω中元素ωk對應的先驗分布參數。進一步地,所述根據所述最優模型NMoptim確定所述符號網絡N中每個節點i所屬的社區,0<i≤n包括:根據所述最優模型NMoptim的指示變量Z的近似分布參數τ,確定所述符號網絡N中每個節點i所屬的社區,0<i≤n;其中,所述節點i屬于近似分布參數τik最大的社區。第二方面,提供了一種基于統計模型的社區挖掘系統,所述社區挖掘系統包括:初始化模塊,用于讀取符號網絡N的鄰接矩陣A,設置社區數K的變化范圍為[Kmin,Kmax],并初始化社區數K=Kmin,其中,所述符號網絡N的節點總數為n,Kmin和Kmax為n范圍內的整數;擬合模塊,用于初始化每一個社區數K對應的統計模型NMK,將所述統計模型NMK與所述符號網絡N擬合,并計算所述統計模型NMK的選擇標準HK;比較模塊,用于比較所有統計模型NMK的選擇標準HK,選取選擇標準HK最大的統計模型NMK作為最優模型NMoptim;社區確定模塊,用于根據所述最優模型NMoptim確定所述符號網絡N中每個節點i所屬的社區,0<i≤n。進一步地,所述擬合模塊包括:構建單元,用于對于變化范圍[Kmin,Kmax]內的每一個社區數K,構建與所述社區數K對應的統計模型NMK=(n,K,Z,π,Ω);初始化單元,用于初始化統計模型NMK中的第一參數π對應的近似分布參數η、第二參數Ω對應的近似分布參數ρ以及指示變量Z對應的近似分布參數τ;其中,第一參數π為K×K×3維向量,表示社區間連接概率,所述第一參數π中的每一個元素πlq包括三個分量,且滿足:0<l≤K,0<q≤K,分量πlq1表示第l個社區與第q個社區間節點存在一條正鏈接的概率,分量πlq2表示第l個社區與第q個社區間節點沒有鏈接的概率,分量πlq3表示第l個社區與第q個社區間節點存在一條負鏈接的概率;第二參數Ω為K維向量,表示節點屬于社區的概率,所述第二參數Ω中的每一個元素ωk滿足:0<k≤K;所述指示變量Z為n×K維向量,用于指示每個節點i所屬的社區;該指示變量Z的每一行中只有一個元素zik為1,其余元素zik為0,0<i≤n,0<k≤K。進一步地,所述擬合模塊還包括:更新單元,用于將當前的統計模型NMK與所述符號網絡N擬合,按照預設計算公式更新所述指示變量Z對應的近似分布參數τ、第一參數π對應的近似分布參數η、第二參數Ω對應的近似分布參數ρ;計算單元,用于根據更新后的所述指示變量Z對應的近似分布參數τ、第一參數π對應的近似分布參數η、第二參數Ω對應的近似分布參數ρ計算所本文檔來自技高網...
    基于統計模型的社區挖掘方法及系統

    【技術保護點】
    一種基于統計模型的社區挖掘方法,其特征在于,所述社區挖掘方法包括:讀取符號網絡N的鄰接矩陣A,設置社區數K的變化范圍為[K

    【技術特征摘要】
    1.一種基于統計模型的社區挖掘方法,其特征在于,所述社區挖掘方法包括:讀取符號網絡N的鄰接矩陣A,設置社區數K的變化范圍為[Kmin,Kmax],并初始化社區數K=Kmin,其中,所述符號網絡N的節點總數為n,Kmin和Kmax為n范圍內的整數;初始化每一個社區數K對應的統計模型NMK,將所述統計模型NMK與所述符號網絡N擬合,并計算所述統計模型NMK的選擇標準HK;比較所有統計模型NMK的選擇標準HK,選取選擇標準HK最大的統計模型NMK作為最優模型NMoptim;根據所述最優模型NMoptim確定所述符號網絡N中每個節點i所屬的社區,0<i≤n。2.如權利要求1所述的基于統計模型的社區挖掘方法,其特征在于,所述初始化每一個社區數K對應的統計模型NMK包括:對于變化范圍[Kmin,Kmax]內的每一個社區數K,構建與所述社區數K對應的統計模型NMK=(n,K,Z,π,Ω);初始化統計模型NMK中的第一參數π對應的近似分布參數η、第二參數Ω對應的近似分布參數ρ以及指示變量Z對應的近似分布參數τ;其中,第一參數π為K×K×3維向量,表示社區間連接概率,所述第一參數π中的每一個元素πlq包括三個分量,且滿足:0<l≤K,0<q≤K,分量πlq1表示第l個社區與第q個社區間節點存在一條正鏈接的概率,分量πlq2表示第l個社區與第q個社區間節點沒有鏈接的概率,分量πlq3表示第l個社區與第q個社區間節點存在一條負鏈接的概率;第二參數Ω為K維向量,表示節點屬于社區的概率,所述第二參數Ω中的每一個元素ωk滿足:0<k≤K;所述指示變量Z為n×K維向量,用于指示每個節點i所屬的社區;該指示變量Z的每一行中只有一個元素zik為1,其余元素zik為0,0<i≤n,0<k≤K。3.如權利要求2所述的基于統計模型的社區挖掘方法,其特征在于,所述將所述統計模型NMK與所述符號網絡N擬合,并計算所述統計模型NMK的選擇標準HK包括:A:將當前的統計模型NMK與所述符號網絡N擬合,按照預設計算公式更新所述指示變量Z對應的近似分布參數τ、第一參數π對應的近似分布參數η、第二參數Ω對應的近似分布參數ρ;B:根據更新后的所述指示變量Z對應的近似分布參數τ、第一參數π對應的近似分布參數η、第二參數Ω對應的近似分布參數ρ計算所述統計模型NMK的選擇標準HK,并計算所述選擇標準HK與上一次迭代計算得到的選擇標準HK之間的差值;C:比較所述差值與預設閾值,若所述差值小于所述預設閾值,則以本次更新的所述指示變量Z對應的近似分布參數τ、第一參數π對應的近似分布參數η、第二參數Ω對應的近似分布參數ρ作為所述統計模型NMK的最優參數;否則,返回步驟A進行下一次迭代計算。4.如權利要求3所述的基于統計模型的社區挖掘方法,其特征在于,所述選擇標準HK的計算公式為:其中,τik表示指示變量Z中元素zik對應的近似分布參數,ηlqh表示第一參數π中元素πlqh對應的近似分布參數,表示第一參數π中元素πlqh對應的先驗分布參數,ρ表示第二參數Ω中元素ωk對應的近似分布參數,表示第二參數Ω中元素ωk對應的先驗分布參數。5.如權利要求1至4任一項所述的基于統計模型的社區挖掘方法,其特征在于,所述根據所述最優模型NMoptim確定所述符號網絡N中每個節點i所屬的社區,0<i≤n包括:根據所述最優模型NMoptim的指示變量Z的近似分布參數τ,確定所述符號網絡N中每個節點i所屬的社區,0<i≤n;其中,所述節點i屬于近似分...

    【專利技術屬性】
    技術研發人員:趙學華楊博陳慧靈劉學艷
    申請(專利權)人:深圳信息職業技術學院
    類型:發明
    國別省市:廣東,44

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 国内精品人妻无码久久久影院导航 | 无码人妻AV一二区二区三区| 亚洲一区二区无码偷拍| 国产午夜无码精品免费看| 无码av人妻一区二区三区四区| 2020无码专区人妻系列日韩| 亚洲国产精品无码久久一线| 无码人妻av一区二区三区蜜臀| 亚洲AV无码国产在丝袜线观看| 无码天堂va亚洲va在线va| 亚洲精品无码MV在线观看| 亚洲av中文无码| 亚洲天然素人无码专区| 亚洲av无码无在线观看红杏| 国产成人无码免费网站| 国产乱人伦中文无无码视频试看| 少妇人妻无码精品视频| 国产亚洲精品无码成人| 亚洲熟妇少妇任你躁在线观看无码| 中文字幕无码不卡免费视频| 亚洲av无码乱码国产精品fc2| 午夜成人无码福利免费视频| 无码熟妇人妻av| 亚洲精品无码aⅴ中文字幕蜜桃| 亚洲日韩欧洲无码av夜夜摸| 中文字幕乱偷无码AV先锋| 国产aⅴ激情无码久久久无码 | 亚洲GV天堂无码男同在线观看| 亚洲国产精品无码av| 日韩精品无码免费专区午夜| 一区二区三区无码高清| 免费无码又爽又刺激高潮| 好了av第四综合无码久久| 无码国产精成人午夜视频不卡| 中文字幕乱偷无码av先锋蜜桃| 久久精品中文字幕无码绿巨人| 无码午夜人妻一区二区三区不卡视频 | 亚洲精品高清无码视频| 国产成人午夜无码电影在线观看 | 人妻无码一区二区视频| 亚洲人成国产精品无码|