• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>
    當前位置: 首頁 > 專利查詢>江蘇大學專利>正文

    可能模糊K調和均值聚類方法及系統技術方案

    技術編號:8594140 閱讀:280 留言:0更新日期:2013-04-18 07:21
    本發明專利技術提供了一種可能模糊K調和均值聚類方法及系統,該方法包括以下步驟:確定聚類的初始類中心;設置聚類算法的參數值;計算樣本數據的協方差;計算可能模糊K調和均值聚類的模糊隸屬度值;計算可能模糊K調和均值聚類的典型值;計算可能模糊K調和均值聚類的聚類中心值;判斷是否滿足迭代終止條件,若滿足則迭代終止,若不滿足則繼續進行迭代計算;利用模糊隸屬度值和典型值最終實現數據集的劃分。本發明專利技術有效地處理含噪聲數據,能得到模糊隸屬度值和典型值,其中典型值不同于模糊隸屬度值,典型值沒有可能性約束條件,因而對噪聲不敏感,聚類準確率高,聚類速度快。

    【技術實現步驟摘要】

    本專利技術涉及聚類分析
    ,尤其涉及一種可能模糊K調和均值聚類方法及系 統。
    技術介紹
    聚類是一種無監督學習方法,它尋找數據之間的相互聯系,按照相似性原則進行 分類,就是“物以類聚”。聚類廣泛應用于模式分類,文本信息提取,圖像分割和數據挖掘等 領域。K-均值聚類是著名的聚類方法之一,給定一個數據集和聚類數目k,K-均值聚類能 簡潔有效地劃分數據集。但是,K-均值聚類的聚類結果依賴于初始聚類中心的選擇,不同 的初始聚類中心會導致不同的聚類結果,所以,K-均值聚類對初始聚類中心敏感而導致聚 類結果不穩定。另外,K-均值聚類容易陷入局部極小點。1999年Zhang等人提出K調和均值聚類,是一種基于中心的迭代聚類方法。K調 和均值聚類將所有數據點到每個聚類中心的調和平均值的和作為聚類的目標函數。實驗表 明,由于提升函數的作用使K調和均值聚類對初始聚類中心不敏感。但是,K調和均值聚類 也容易陷入局部極小點。因此,許多學者針對此問題展開研究。Yang等人將粒子群優化和 K調和均值聚類相結合,提出一種粒子群優化的K調和均值聚類方法(PSOKHM),PSOKHM能避 免局部極小點,并且解決了粒子群優化收斂速度慢問題。由于蟻群聚類方法能解決局部極 小點問題,Jiang等人提出一種基于蟻群聚類的K調和均值聚類方法。在給定初始溫度值后 模擬退火用來搜尋一些空間分子的平衡狀態,它是一種求解組合優化問題的方法。和Ctaler在模擬退火和K調和均值聚類基礎上提出一種新的聚類算法以求得K調和均值聚 類的全局最優解。禁忌搜索是一種全局逐步尋優算法,Gitagfir和利用禁忌搜索方法提 出禁忌K調和均值聚類方法,該方法解決了 K調和均值聚類的局部極小點問題。以上方法 主要是解決K調和均值聚類容易陷入局部極小點這個問題。而目前有關K調和均值聚類噪 聲敏感性問題沒有發現和解決。本專利技術指出K調和均值聚類對噪聲敏感,同時解決這個噪聲敏感問題。聚類噪聲 敏感性問題是聚類方法中一個重要的研究熱點,比如Dav6將噪聲看作一個獨立的類,定 義噪聲距離為常數,提出一種處理含噪聲數據的噪聲聚類方法。模糊C-均值聚類(FCM)是 一種建立在平方誤差最小準則基礎上的模糊聚類算法,通過可能性約束條件,FCM使數據點 在所有類中的隸屬度之和為I。可能性約束條件避免了所有隸屬度為O的平凡解,但是造成 了 FCM對噪聲敏感。為了克服FCM的這個缺點,Krishnapuram和Keller放棄了 FCM的可 能性約束條件,構造了一個新的目標函數,提出了可能C-均值聚類(PCM)。PCM能夠聚類包 含噪聲或野值點的數據,PCM使噪聲數據具有很小的隸屬度值,因而噪聲對聚類的影響可以 忽略。但是PCM對初始聚類中心很敏感,常常會導致一致性聚類結果[49]。PCM重視了典 型性思想,從而減少了噪聲對聚類的影響,但它忽略了模糊隸屬度,模糊隸屬度可以使類中 心和數據緊密聯系在一起。為了克服FCM對噪聲數據敏感和PCM產生一致性聚類的缺點, Pal等在FCM和PCM的基礎上提出了可能模糊C-均值聚類(PFCM)。有鑒于此,有必要提出一種可能模糊K調和均值聚類方法及系統以解決上述問題。
    技術實現思路
    本專利技術的目的在于提供一種可能模糊K調和均值聚類方法及系統,從而解決K調和均值聚類噪聲敏感性問題。本專利技術的一種可能模糊K調和均值聚類方法,所述方法包括以下步驟S1、確定聚類的初始類中心S2、設置聚類算法的參數值S3、計算樣本數據的協方差S4、計算可能模糊K調和均值聚類的模糊隸屬度值;S5、計算可能模糊K調和均值聚類的典型值;S6、計算可能模糊K調和均值聚類的聚類中心值;S7、判斷是否滿足迭代終止條件,若滿足則迭代終止,若不滿足則返回步驟S3 S6 繼續進行迭代計算;S8、利用模糊隸屬度值和典型值最終實現數據集的劃分。作為本專利技術的進一步改進,所述步驟S2具體為確定類別數k,數據的個數η和權重指數m和q的值,且滿足n>k ^ 2, + >m, q>l ;設置迭代次數初始值r=l和最大迭代次數為rmax ;設置迭代最大誤差參數ε ;設置常數a和b的值。作為本專利技術的進一步改進,所述步驟S3中樣本數據的協方差計算公式為本文檔來自技高網
    ...

    【技術保護點】
    一種可能模糊K調和均值聚類方法,其特征在于,所述方法包括以下步驟:S1、確定聚類的初始類中心;S2、設置聚類算法的參數值;S3、計算樣本數據的協方差;S4、計算可能模糊K調和均值聚類的模糊隸屬度值;S5、計算可能模糊K調和均值聚類的典型值;S6、計算可能模糊K調和均值聚類的聚類中心值;S7、判斷是否滿足迭代終止條件,若滿足則迭代終止,若不滿足則返回步驟S3~S6繼續進行迭代計算;S8、利用模糊隸屬度值和典型值最終實現數據集的劃分。

    【技術特征摘要】
    1.一種可能模糊K調和均值聚類方法,其特征在于,所述方法包括以下步驟 51、確定聚類的初始類中心; 52、設置聚類算法的參數值; 53、計算樣本數據的協方差; 54、計算可能模糊K調和均值聚類的模糊隸屬度值; 55、計算可能模糊K調和均值聚類的典型值; 56、計算可能模糊K調和均值聚類的聚類中心值; 57、判斷是否滿足迭代終止條件,若滿足則迭代終止,若不滿足則返回步驟S3 S6繼續進行迭代計算; 58、利用模糊隸屬度值和典型值最終實現數據集的劃分。2.根據權利要I所述的可能模糊K調和均值聚類方法,其特征在于,所述步驟S2具體為確定類別數k,數據的個數n和權重指數m和q的值,且滿足n>k彡2, + >m, q>l ;設置迭代次數初始值r=l和最大迭代次數為設置迭代最大誤差參數e ;設置常數a和b的值。3.根據權利要I所述的可能模糊K調和均值聚類方法,其特征在于,所述步驟S3中樣本數據的協方差計算公式為 ,IjrZ-^If,其中J = 士,xj為第j個樣本數據,F為樣本均值,。2為樣本數據的協方差。4.根據權利要I所述的可能模糊K調和均值聚類方法,其特征...

    【專利技術屬性】
    技術研發人員:武小紅孫俊武斌吳瑞梅
    申請(專利權)人:江蘇大學
    類型:發明
    國別省市:

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 国产AV无码专区亚洲AV男同| 国产成人午夜无码电影在线观看| 无码精品A∨在线观看中文| 精品无码中文视频在线观看| 国产精品三级在线观看无码 | 亚洲AV日韩AV永久无码色欲| 国外AV无码精品国产精品| 亚洲AV无码不卡无码| 精品无码中出一区二区| 99久久人妻无码精品系列| 亚洲熟妇无码乱子AV电影| 亚洲av无码片vr一区二区三区| 国模GOGO无码人体啪啪| yy111111少妇无码影院| 亚洲av无码成人精品区一本二本 | 国产AV无码专区亚洲AV男同| 无码av天天av天天爽| 无码国产精品一区二区免费式直播 | 亚洲av无码一区二区三区在线播放| 亚洲国产精品无码AAA片| 亚洲午夜无码片在线观看影院猛| 精品无码一区二区三区在线| 国产a级理论片无码老男人| 国产亚洲?V无码?V男人的天堂 | 制服在线无码专区| 少妇无码一区二区三区免费| 一本色道久久HEZYO无码| 中文无码熟妇人妻AV在线| 亚洲AV蜜桃永久无码精品| 精品人妻无码专区在中文字幕| 久久精品无码一区二区三区免费| 无码精品国产dvd在线观看9久| 亚洲AV无码乱码在线观看代蜜桃 | 久久久久亚洲av无码尤物| 国产日韩精品中文字无码| 久久久久亚洲av成人无码电影| 无码AⅤ精品一区二区三区| 手机在线观看?v无码片| AV无码小缝喷白浆在线观看| 超清无码一区二区三区| 国产午夜鲁丝无码拍拍|