• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種基于網絡拓撲結構和節點屬性的社團檢測方法技術

    技術編號:10363029 閱讀:190 留言:0更新日期:2014-08-27 19:04
    本發明專利技術公開了一種基于網絡拓撲結構和節點屬性的社團檢測方法,其過程:首先利用PageRank算法得到網絡中每個節點基于全局拓撲結構的重要性,利用節點的鄰居結構,計算節點之間的結構上的鏈接緊密程度;然后根據節點屬性的不同形式,采用不同的抽取方法及屬性相似度計算方法;再用權重調節因子調節二者的平衡性,最后利用在聚類過程中,節點鄰居與類別中心節點鄰居的相似度作為節點屬于該類別的程度。本發明專利技術提出的基于網絡拓撲結構和節點屬性的社團檢測方法,得到的社團具有較高的鏈接密度和較好的同質性。

    【技術實現步驟摘要】
    一種基于網絡拓撲結構和節點屬性的社團檢測方法
    本專利技術涉及PageRank技術、網絡拓撲結構分析技術、主題模型技術、屬性抽取技術、屬性間相似性度量技術、社團檢測及聚類算法
    ,具體地說是一種基于復雜網絡拓撲結構和網絡節點屬性信息的社團檢測技術。
    技術介紹
    近年來復雜網絡越來越受到關注,比如社交網絡,科學家合著網絡,電子郵件網絡等。在這些網絡中,節點可以表示為一個人或者一篇文章等,網絡中屬性信息(比如社交網上用戶的性別,愛好;論文合著網絡上作者的研究領域),網絡中節點之間的鏈接性以及節點具有的屬性信息構成了屬性圖。基于屬性圖的社團檢測的目標是劃分這個屬性圖,使得同一個社團的節點比不同社團之間的節點連接更加緊密,而且同一個社團內部屬性盡可能相似。傳統的社團檢測方法大部分是基于圖的拓撲結構(即節點之間的鏈接關系),基于屬性相似。基于拓撲結構的方法主要可以分為三種類型:圖劃分、圖密度、層級結構聚類。圖劃分通過往網絡圖中加邊或刪邊的方式達到社團檢測目的;圖密度基于圖的拓撲結構的鏈接密度進行社團檢測;層次結構聚類基于節點間鏈接的強度將網絡劃分為若干社團。另外還有基于遺傳優化的方法,利用生物學的進化思想適者生存,從目標函數中選擇最優個體即為最終的社團劃分。基于屬性相似的方法一般做法是,通過某種判斷方法將屬性相似的劃分到同一個社團,最終得到的社團能夠滿足同一個社團的屬性信息是相似的。以上單獨基于網絡拓撲結構的方法,未考慮屬性對檢測過程構成的影響,從而檢測到的社團內部節點鏈接緊密度較高,但節點之間屬性相似度不高;基于屬性相似的方法,未考慮網絡拓撲結構,從而檢測到的社團往往具有屬性相似,但是社團內部的鏈接緊密度不高。考慮到上述的不足,近年來學者把網絡拓撲結構和屬性信息結合起來考慮,主要有:基于距離的方法和基于模型的方法。基于距離的方法結合拓撲結構和節點的屬性信息,利用隨機游走算法計算網絡中節點之間的距離(某一意義上說是節點之間的相似性),從而得到節點之間的距離,再通過一定的聚類方法對節點進行聚類。基于模型的方法主要是利用概率模型,節點的所屬社團是一個概率分布,通過衡量節點之間連接的概率,再利用聚類算法,或者最大似然估計算法,進行社團檢測。然而基于隨機游走的距離算法涉及矩陣相乘,具有較高的時間復雜度;另外目前的大部分方法沒有考慮到網絡節點在網絡拓撲結構上的全局重要性,沒有將節點的全局重要性和局部拓撲結構(即節點的鄰居這一特性)相結合。
    技術實現思路
    本專利技術的目的是針對現有技術的不足而提供的一種基于網絡拓撲結構和節點屬性信息相結合的、更加高效的社團檢測方法,該方法針對有向圖提出了節點在網絡拓撲結構的重要性和節點的局部鄰居結構相結合,得到節點之間的鏈接強度,再結合節點之間的屬性相似度,最后通過聚類方法將節點聚集到相應的社團。實現本專利技術目的的具體技術方案是:一種基于網絡拓撲結構和節點屬性的社團檢測方法,該方法包括以下步驟:a)節點拓撲結構鏈接強度分析計算網絡中節點基于拓撲結構的重要性,利用節點的局部鄰居,重新度量節點之間的鏈接強度;b)節點屬性抽取及相似性度量抽取出屬性,然后根據不同的屬性類型,計算節點之間每個屬性的相似度,最后計算節點之間所有屬性的相似度;c)拓撲結構與屬性相結合在求得節點之間的鏈接強度和節點屬性相似度之后,利用權重調節因子結合二者,作為節點之間基于拓撲結構和屬性的相似度。d)節點聚類首先初始化類別中心節點,然后根據每個節點與類別中心的相似度進行節點類別劃分,再更新類別中心節點,最后計算目標函數值判斷是否收斂。所述步驟a)中計算網絡中節點基于拓撲結構的重要性,具體包括:首先構建節點的鄰接矩陣A,讀取整個網絡結構后,構建鄰接矩陣,若存在節點vi到vj的鏈接,則對應位置處設置為1,否則為0;再采用PageRank算法計算節點基于拓撲結構的PageRank值,該值作為節點基于全局網絡拓撲結構的重要性程度,算法運行后得到每個節點的重要性bi;所述步驟a)中重新度量節點之間的鏈接強度,具體包括:節點vi和vj之間的鏈接強度為節點vi到vj的鏈接強度與節點vj到vi的鏈接強度之和;而vi到vj的鏈接強度為vj的全局重要性bj除以節點vi的所有鏈出鄰居節點的全局重要性之和;同理計算出vj到vi的鏈接強度;節點vi到vj的鏈接強度TS(i,j)計算公式如下:其中,NO(i)表示節點vi的鏈出鄰居集,根據上述計算公式,得到節點vi和vj之間的鏈接強度TsS(i,j),計算如下:TsS(i,j)=TS(i,j)+TS(j,i)。所述步驟b)中抽取出屬性,具體包括:若節點的描述信息為文本內容,則用潛在狄利克雷(LDA)主題模型抽取該文本信息的主題分布,然后將該主題分布作為該節點的屬性;若節點的描述信息為離散的或者連續的,則直接將它們作為節點的屬性。所述步驟b)中計算節點之間每個屬性的相似度,具體包括:對于離散型屬性,直接比較屬性的相同與否;對于連續型屬性,利用歐幾里得公式計算屬性的相似度;對于文本型屬性,在得到該文本主題分布后,利用余弦相似度方法度量屬性相似度。所述步驟b)中節點之間所有屬性相似度計算,具體包括:在得到節點之間每個屬性的相似度之后,將這些屬性相似度統一計算作為節點間所有的屬性相似度XS(i,j);計算如下:其中表示節點vi和vj在單個屬性ar上的相似度,war表示屬性ar的權重,m表示節點的屬性個數。所述步驟c)中節點之間基于拓撲結構和屬性的相似度PaS(i,j),具體計算如下:PaS(i,j)=(1-λ)·TsS(i,j)+λ·XS(i,j),λ∈(0,1)。其中λ為節點間鏈接強度和屬性相似度的權重調節參數。所述步驟d)中初始化類別中心節點是:結合節點基于結構和屬性的相似性,先通過引入函數將節點之間的相似性映射到[0,1)的范圍,并將此值作為節點歸一化后的節點相似性;然后計算每個節點和整個網絡的其他節點的相似性,得到節點在全局網絡的基于拓撲結構和屬性的重要性,該重要性作為節點的全局影響力,按節點影響力的大小進行降序排序,選擇前K個影響力最大的節點作為初始化K個類別的中心節點。所述步驟d)中節點類別劃分具體包括:計算每個節點vi與每個類別的中心節點cj的相似性,首先分別求得節點vi和中心節點cj的鄰居節點集,然后計算節點vi和cj的鄰居節點之間的相似性S(i,j),其中包括鏈入鄰居和鏈出鄰居,把這個相似性作為節點vi分配到該類別的可能性,通過計算vi與每個類別中心cj的相似性,選擇其中最大的一個作為vi該次迭代所分配到的類別;計算如下:其中PaS(NIO(i),NIO(j))表示節點vi的鄰居和中心節點cj的鄰居的相似度,|NIO(i)|表示節點vi的鄰居數,|NIO(j)|表示類別中心節點cj的鄰居數。所述步驟d)中更新類別中心節點是:在分配每個節點的類別歸屬后,計算每個類別內部節點間的平均相似度,對于每個類別選擇一個與本類別平均相似度最接近的點作為中心節點,考慮到選擇出來的中心節點可能與本類別的其他節點屬性上相似較大,而結構上鏈接不強,在選擇中心節點的過程中增加一個限制條件,即選出來的中心節點的度數(所有鄰居的個數)大于本類別節點的平均度數。所述步驟d)中計算目標函數值判斷是否收斂是:計算整個網絡劃分本文檔來自技高網
    ...
    一種基于網絡拓撲結構和節點屬性的社團檢測方法

    【技術保護點】
    一種基于網絡拓撲結構和節點屬性的社團檢測方法,其特征在于,所述的方法包括以下步驟:a)節點拓撲結構鏈接強度分析計算網絡中節點基于拓撲結構的重要性,利用節點的局部鄰居,重新度量節點之間的鏈接強度;b)節點屬性抽取及相似性度量抽取出屬性,然后根據不同的屬性類型,計算節點之間每個屬性的相似度,最后計算節點之間所有屬性的相似度;c)拓撲結構與屬性相結合在求得節點之間的鏈接強度和節點屬性相似度之后,利用權重調節因子結合二者,作為節點之間基于拓撲結構和屬性的相似度。d)節點聚類首先初始化類別中心節點,然后根據每個節點與類別中心的相似度進行節點類別劃分,再更新類別中心節點,最后計算目標函數值判斷是否收斂。

    【技術特征摘要】
    1.一種基于網絡拓撲結構和節點屬性的社團檢測方法,其特征在于,所述的方法包括以下步驟:a)節點拓撲結構鏈接強度分析計算網絡中節點基于拓撲結構的重要性,利用節點的局部鄰居,重新度量節點之間的鏈接強度,包括:首先構建節點的鄰接矩陣A,讀取整個網絡結構后,構建鄰接矩陣,若存在節點vi到vj的鏈接,則對應位置處設置為1,否則為0;再采用PageRank算法計算節點基于拓撲結構的PageRank值,該值作為節點基于全局網絡拓撲結構的重要性程度,算法運行后得到每個節點的重要性bi;所述步驟a)中重新度量節點之間的鏈接強度,還包括:節點vi和vj之間的鏈接強度為節點vi到vj的鏈接強度與節點vj到vi的鏈接強度之和;而節點vi到vj的鏈接強度為vj的全局重要性bj除以節點vi的所有鏈出鄰居節點的全局重要性之和;同理計算出vj到vi的鏈接強度;節點vi到vj的鏈接強度TS(i,j)計算公式如下:其中,NO(i)表示節點vi的鏈出鄰居集,根據上述計算公式,得到節點vi和vj之間的鏈接強度TsS(i,j),計算如下:TsS(i,j)=TS(i,j)+TS(j,i);b)節點屬性抽取及相似性度量抽取出屬性,然后根據不同的屬性類型,計算節點之間每個屬性的相似度,最后計算節點之間所有屬性的相似度;c)拓撲結構與屬性相結合在求得節點之間的鏈接強度和節點屬性的相似度之后,利用權重調節因子結合二者,作為節點之間基于拓撲結構和屬性的相似度;d)節點聚類首先初始化類別中心節點,然后根據每個節點與類別中心的相似度進行節點類別劃分,再更新類別中心節點,最后計算目標函數值判斷是否收斂。2.根據權利要求1所述的方法,其特征在于所述步驟b)中抽取出屬性,具體包括:若節點的描述信息為文本內容,則用潛在狄利克雷LDA主題模型抽取該文本信息的主題分布,然后將該主題分布作為該節點的屬性;若節點的描述為離散的或者連續的,則直接將它們作為節點的屬性。3.根據權利要求1所述的方法,其特征在于所述步驟b)中計算節點之間每個屬性的相似度,具體包括:對于離散型屬性,直接比較屬性的相同與否;對于連續型屬性,利用歐幾里得公式計算屬性的相似度;對于文本型屬性,在得到該文本主題分布后,利用余弦相似度方法度量屬性相似度。4.根據權利要求1所述的方法,其特征在于所述步驟b)中節點之間所有屬性相似度計算,具體包括:在得到節點之間每個屬性的相似度之后,將這些屬性相似度統一計算作為節點間所有的屬性相似度XS(i,j);計算如下:

    【專利技術屬性】
    技術研發人員:呂釗吳鐘剛
    申請(專利權)人:華東師范大學
    類型:發明
    國別省市:上海;31

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 日韩精品无码一区二区三区四区| 狠狠躁天天躁无码中文字幕| 亚洲成a∨人片在无码2023| 亚洲av无码一区二区三区乱子伦| 无码中文人妻视频2019| 亚洲人成网亚洲欧洲无码| 人妻系列AV无码专区| 亚洲aⅴ天堂av天堂无码麻豆| 久久久久无码精品| 99精品人妻无码专区在线视频区 | 亚洲Av无码专区国产乱码DVD| 一本久道综合在线无码人妻| 国产成人无码精品一区在线观看 | 无码国产精成人午夜视频不卡| 久久久久久国产精品无码下载| av无码久久久久不卡免费网站| 亚洲色无码专区在线观看| 国产AV无码专区亚洲AV琪琪 | 无码专区永久免费AV网站| 亚洲AV中文无码乱人伦下载| 在线A级毛片无码免费真人| 高清无码午夜福利在线观看| 亚洲AV无码精品色午夜在线观看| 无码国产精品一区二区高潮| 一区二区无码免费视频网站| 亚洲va无码手机在线电影| 成人无码AV一区二区| 精品无码国产自产拍在线观看蜜 | 无码一区二区波多野结衣播放搜索| 亚洲欧洲日产国码无码久久99| 天码av无码一区二区三区四区 | 国产激情无码一区二区| 亚洲AV无码一区二区三区在线观看 | 亚洲大尺度无码无码专线一区| 人妻夜夜添夜夜无码AV| 亚洲AV中文无码乱人伦下载 | 亚洲国产综合无码一区二区二三区 | 水蜜桃av无码一区二区| 日韩精品无码专区免费播放| 熟妇无码乱子成人精品| 在线观看亚洲AV每日更新无码|