本發明專利技術公開了一種網絡中基于節點相似度的網絡社區劃分方法,包括以下步驟:抽取用戶對于網絡社區劃分的偏好信息并確定屬性權重;從網絡中的用戶配置文件中獲取數據集;以每個節點為一個網絡社區,計算不同網絡社區間的相似度,并將網絡社區對按照相似度生成最大堆;選擇具有最大相似度的節點對進行合并;計算新網絡社區與其它網絡社區間的相似度,插入至最大堆,并從最大堆中刪除被合并網絡社區的相關記錄;計算新的網絡社區劃分的Q值;重復上述步驟直至所有節點都被合并至同一網絡社區中,并找出Q值極值點及其相應劃分;修改各屬性權重,重復算法;匯總不同權重取值時的Q值極值及相應網絡劃分,將其中Q值較高的多個劃分推薦給用戶。
【技術實現步驟摘要】
本專利技術涉及計算機軟件
,特別是,通過對網絡中節點及鏈接屬性的分析實現對復雜網絡中節點的網絡社區劃分。
技術介紹
網絡結構廣泛存在于自然界和現實生活中,如通訊網絡、交通網絡、電力網絡、航空網絡、食物鏈網絡及蛋白質交互網絡等,雖然上述網絡結構來自于不同領域, 具有不同背景,但具有相似的結構特征,如網絡的“無尺度特性(Power-Law) ”、“小世界特性(Small-World) ”、“高聚集系數(High Clustering Coeff icient) ”、“ 自相似性 (Self-Similarity) ”等;同時,網絡連接結構可能會隨時間而不斷變化,且連接間可能具有不同的權重或方向。現實社會中人也不是孤立的,人與人之間的親戚關系、朋友關系、上下級關系、同時關系等不同的社會交互構成了一種重要的社會關系網絡,簡稱社會網絡。社會網絡具有廣泛的應用價值,目前已被引入各種領域,如廣告傳播與市場營銷、計算機病毒與犯罪網絡及IT與通信行業等。由于社會網絡中含有眾多個體及個體間的關聯信息,具有重要的研究 與分析價值,因而社會網絡分析成為數據挖掘的一個重要分支,如何從復雜網絡結構中挖掘出潛在的模式和知識成為數據挖掘中一個新興的熱點研究領域。隨著對實際網絡拓撲結構和物理意義的深入研究,研究人員逐漸發現除了典型的 “無尺度”、“小世界”及“高聚集系數”等特征外,現實世界的網絡還具有“網絡社區結構”,即網絡社區內節點之間的連接相對非常緊密,但各網絡社區之間的連接相對較為稀疏,這些網絡社區結構代表了社會網絡中具有相同興趣或偏好的團體。如何快速有效地發現網絡中的網絡社區結構對于揭示網絡的局部功能與其自身的拓撲結構之間的相互影響的關系具有十分重要的推動作用。對于社會網絡中網絡社區結構的探測,學術界已經進行了大量的研究。例如,Μ. E. J. Newman 等人 在“Finding and evaluating community structure in networks (Physical Review E, Vol. 69, No. 2, pp. 026113, 2003) ” 中提出了 一種基于層次聚類算法的邊消去算法,算法利用最短路徑求出每條邊的“betweenness”值,然后每次去掉網絡中“betweenness”值最大的邊,并引入“模塊化度”作為評價網絡社區劃分結果的評價指標;之后 Μ. E. J. Newman 在 “Fast algorithm for detecting community structure in networks (Physical Review E, Vol. 60,No. 6,pp. 066133,2004),,中提出了效率更高的基于每條邊“betweenness”值的網絡社區發現算法;Ye, Z.等人在“Adaptive clustering algorithm for community detection in complex networks (Physical Review E, Vol. 78,No. 4,pp. 046115,2008) ”中根據自適應及自組織動力學特征提出7 一種網絡社區發現算法,能避免節點誤劃分入不正確網絡社區后不能重新加入正確網絡社區的情況;Nan Du 等人在 “Overlapping community structure detection in networks (Proceedings of the 17th ACM conference on Information and knowledge managem ent(CIKM’ 08), pp. 1371-1372,2008) ”中提出了一種基于局部算法的重疊網絡社區發現算法;Liu Xu 等人在 “Community detection by neighborhood similarity (CHIN. PHYS. LETT.,Vol. 29,No. 4,pp. 048902,2012),,中;Tore Opsahl 等人在 “Clustering in weightednetworks (Social Networks, Vol. 31, No. 2, pp. 155-163,2009) ” 中對帶權重的網絡社區發現進行了探討;Μ. E. J. Newman 在“Analysis of weighted networks (Physical ReviewE, Vol. 70,No. 5,pp. 056131,2004) ”中提出了一種將加權網絡轉化為不加權網絡的映射方法。但我們發現在已有的研究方法都是利用網絡的拓撲結構對網絡中的網絡社區進行探索,并沒有綜合利用網絡中的節點信息,從而可能會造成網絡社區結構劃分的不精確,達不到用戶的理想要求;同時,隨著網絡社區結構探測研究的不斷深入,用戶對網絡社區結構的需求也趨于多樣化,不同用戶之間對于網絡社區結構探測的出發點或偏好不同,因此,以往只向用戶提供單一劃分結果的研究方法逐漸不能滿足用戶的需求
技術實現思路
專利技術目的本專利技術所要解決的技術問題是針對現有技術的不足,提供。本專利技術公開了一種互聯網基于節點相似度的網絡社區劃分方法,包括以下步驟步驟1,從網絡中的用戶配制文件和用戶日志文件中抽取用戶對于網絡社區劃分的偏好息;步驟2,從網絡中的用戶配置文件中獲取數據集,所述數據集包含所有節點的屬性值及節點之間的鏈接屬性值;設定節點總屬性權重與鏈接屬性權重取值集合,節點總屬性權重值的取值集合為{O. O, O.1, O. 2,O. 3,O. 4,O. 5,O. 6,O. 7,O. 8,O. 9,1. 0},鏈接屬性權重值MV£的取值集合為{O. O, O.1, O. 2,O. 3,O. 4,O. 5,O. 6,O. 7,O. 8,O. 9,1. 0};初始狀態下,節點總屬性權重值wIV為0. 5,鏈接屬性權重值Wrjr為0. 5 ;根據節點屬性數量,設定節點屬性權重值的集合,每個節點屬性權重值為0.1的整數倍,且所有節點屬性權重值之和為1,初始狀態下,每個節點屬性權重值相等;步驟3,以每個節點為一個網絡社區,計算不同網絡社區間的相似度,并將網絡社區對按照相似度生成最大堆,選擇具有最大相似度的節點對進行合并得到新網絡社區;計算新網絡社區與其它網絡社區間的相似度,插入至最大堆,并從最大堆中刪除被合并網絡社區的對應記錄;步驟4,計算網絡社區劃分的模塊度Q值;重復步驟3直至所有節點都被合并至同一網絡社區中,找出模塊度Q值極值點;步驟5,根據步驟2中的節點屬性權重值的集合,修改節點屬性權重值,重復步驟3 步驟4,直至遍歷所有節點屬性權重值;匯總模塊度Q值極值點處的網絡社區劃分,并將網絡社區劃分方案按照Q值極值大小排列;步驟6,根據步驟2中的節點總屬性權重值的集合與鏈接屬性權重值的集合修改節點總屬性權重值K,.與鏈接屬性權重值%+;.,重復步驟3 步驟5,直至遍歷所有節點總屬性權重值與鏈接屬性權重值;匯總所得模塊度Q值極值點處的網絡社區劃分,將網絡社區劃分方案按照Q值極值大小排列輸出。用戶配制文件、用戶日志文件以及用戶配置文件一般存儲于網絡服務器中。本文檔來自技高網...
【技術保護點】
一種網絡中基于節點相似度的網絡社區劃分方法,其特征在于,包括以下步驟:步驟1,從網絡中的用戶配制文件和用戶日志文件中抽取用戶對于網絡社區劃分的偏好信息;步驟2,從網絡中的用戶配置文件中獲取數據集,所述數據集包含所有節點的屬性值及節點之間的鏈接屬性值;設定節點總屬性權重與鏈接屬性權重取值集合,節點總屬性權重值的取值集合為{0.0,0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8,0.9,1.0},鏈接屬性權重值的取值集合為{0.0,0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8,0.9,1.0};初始狀態下,節點總屬性權重值為0.5,鏈接屬性權重值為0.5;根據節點屬性數量,設定節點屬性權重值的集合,每個節點屬性權重值為0.1的整數倍,且所有節點屬性權重值之和為1,初始狀態下,每個節點屬性權重值相等;步驟3,以每個節點為一個網絡社區,計算不同網絡社區間的相似度,并將網絡社區對按照相似度生成最大堆,選擇具有最大相似度的節點對進行合并,得到新網絡社區;計算新網絡社區與其它網絡社區間的相似度,插入至最大堆,并從最大堆中刪除被合并網絡社區的對應記錄;步驟4,計算網絡社區劃分的模塊度Q值;重復步驟3直至所有節點都被合并至同一網絡社區中,找出模塊度Q值極值點;步驟5,根據步驟2中的節點屬性權重值的集合,修改節點屬性權重值,重復步驟3~步驟4,直至遍歷所有節點屬性權重值;匯總模塊度Q值極值點處的網絡社區劃分,并將網絡社區劃分方案按照Q值極值大小排列;步驟6,根據步驟2中的節點總屬性權重值的集合與鏈接屬性權重值的集合修改節點總屬性權重值與鏈接屬性權重值重復步驟3~步驟5,直至遍歷所有節點總屬性權重值與鏈接屬性權重值;匯總所得模塊度Q值極值點處的網絡社區劃分,將網絡社區劃分方案按照Q值極值大小排列輸出。FDA00002468222400011.jpg,FDA00002468222400012.jpg,FDA00002468222400013.jpg,FDA00002468222400014.jpg,FDA00002468222400015.jpg,FDA00002468222400016.jpg...
【技術特征摘要】
1.一種網絡中基于節點相似度的網絡社區劃分方法,其特征在于,包括以下步驟 步驟1,從網絡中的用戶配制文件和用戶日志文件中抽取用戶對于網絡社區劃分的偏好息; 步驟2,從網絡中的用戶配置文件中獲取數據集,所述數據集包含所有節點的屬性值及節點之間的鏈接屬性值;設定節點總屬性權重與鏈接屬性權重取值集合,節點總屬性權重值巧,-的取值集合為{0. 0,0.1, 0. 2,0. 3,0. 4,0. 5,0. 6,0. 7,0. 8,0. 9,1. 0},鏈接屬性權重值wVf 的取值集合為{0. 0,0.1, 0. 2,0. 3,0. 4,0. 5,0. 6,0. 7,0. 8,0. 9,1. 0};初始狀態下,節點總屬性權重值%、'為0. 5,鏈接屬性權重值⑷^為0. 5 ;根據節點屬性數量,設定節點屬性權重值的集合,每個節點屬性權重值為0.1的整數倍,且所有節點屬性權重值之和為1,初始狀態下,每個節點屬性權重值相等; 步驟3,以每個節點為一個網絡社區,計算不同網絡社區間的相似度,并將網絡社區對按照相似度生成最大堆,選擇具有最大相似度的節點對進行合并,得到新網絡社區;計算新網絡社區與其它網絡社區間的相似度,插入至最大堆,并從最大堆中刪除被合并網絡社區的對應記錄; 步驟4,計算網絡社區劃分的模塊度Q值;重復步驟3直至所有節點都被合并至同一網絡社區中,找出模塊度Q值極值點; 步驟5,根據步驟2中的節點屬性權重值的集合,修改節點屬性權重值,重復步驟3 步驟4,直至遍歷所有節點屬性權重值;匯總模塊度Q值極值點處的網絡社區劃分,并將網絡社區劃分方案按照Q值極值大小排列; 步驟6,根據步驟2中的節點總屬性權重值的集合與鏈接屬性權重值的集合修改節點總屬性權重值wW.與鏈接屬性權重值力£ ,重復步驟3 步驟5,直至遍歷所有節點總屬性權重值與鏈接屬性權重值;匯總所得模塊度Q值極值點處的網絡社區劃分,將網絡社區劃分方案按照Q值極值大小排列輸出。2.根據權利要求1所屬的一種基于節點相似度的網絡社區劃分方法,其特征在于,步驟I中,用...
【專利技術屬性】
技術研發人員:竇萬春,張紹謙,
申請(專利權)人:南京大學,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。