• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種特征加權的模糊緊致散布聚類方法技術

    技術編號:10369832 閱讀:162 留言:0更新日期:2014-08-28 12:28
    針對現有的WFCM算法在聚類時沒有考慮樣本硬劃分實際情況,FCS算法沒有考慮硬劃分邊界點的情況以及忽略樣本特征參數對聚類影響的問題,本發明專利技術公開了一種特征加權的模糊緊致散布聚類方法。本發明專利技術通過對樣本隸屬度、特征權重進行調整,遵循了樣本硬劃分的實際情況,并充分考慮樣本特征參數對樣本劃分的影響,盡可能使得樣本類內緊致、類間分散,解決了位于硬劃分邊界的樣本隸屬度問題,對于噪聲數據和異常數據實現了更有效的劃分。聚類性能良好,收斂速度快、迭代效率高。實驗證明,本算法聚類性能良好,收斂速度快、迭代效率高。與現有方法相比,本發明專利技術聚類準確率高,耗時明顯減少,適于應用在工業控制中實時性要求高的場合。

    【技術實現步驟摘要】

    本專利技術屬于數據處理
    ,尤其是涉及。
    技術介紹
    在自然科學和社會科學中,存在著大量的分類問題,聚類方法是研究(樣品或指標)分類問題的一種統計分析方法,同時也是數據挖掘的一個重要算法,應用領域非常廣泛。模糊C-均值(FCM)聚類算法是常用的無監督模式識別方法,有很多對FCM算法的改進,其中基于特征加權的FCM(WFCM)聚類算法考慮了樣本各特征參數對聚類中心的影響,改善了噪聲、異常數據影響等情況。但是,這些基于FCM的聚類算法,實質都只考慮了樣本的類內緊致性(類內散度),而忽略了樣本類間散布性(類間散度)。Kuo-Lung Wu等人提出的FCS (Fuzzy Compactness and Separation)算法考慮了類內緊致和類間散布,并兼容了樣本的硬劃分和模糊劃分,這更符合實際情況;國內有宋風溪等人提出了最大散度差判別準則的分類方法,該準則綜合考慮類間散度和類內散度來求最優投影向量以對樣本進行分類;皋軍等人將模糊度引入了最大散度差判別準則提出了 FMSDC(fuzzy maximum scatterdifference discriminant criterion)算法,在模糊聚類的同時進行了降維;支曉斌等人指出皋軍等人的算法中的錯誤,提出FMSDC-FCS聚類算法,該算法是皋軍等人算法的正確版本,利用FCM算 法初始化隸屬度和樣本均值,再用FMSDC算法進行降維,用FCS算法對降維數據進行聚類,其聚類實質還是采用FCS算法。而在利用上述算法進行數據分類的過程中,我們發現,實際數據有些處于某類硬劃分區域和硬劃分邊界上,這些數據的隸屬度就不需要模糊化,這是FCM算法以及相關擴展FCM算法所不能解決的。FCS算法雖然考慮了樣本硬劃分問題,但是卻沒有考慮處于硬劃分邊界上的樣本情況,這就導致了對實際數據進行分類時,遇到邊界數據時出現分類準確度不高或運算耗時過長的問題。
    技術實現思路
    針對現有的WFCM算法在聚類時沒有考慮樣本硬劃分實際情況,FCS算法沒有考慮硬劃分邊界點的情況以及忽略樣本特征參數對聚類影響的問題,本專利技術公開了。為了達到上述目的,本專利技術提供如下技術方案:,包括如下步驟:步驟一:設置隸屬度指數m、特征加權指數a e [-10, -1] U (I, 10]、β e {0.005, 0.05,0.5,1},初始迭代次數P = O以及迭代誤差ε > O,隨機生成初始聚類中心Bjai為第i類聚類中心),(c為類別數); c步驟二:根據下式計算系數η i:本文檔來自技高網
    ...

    【技術保護點】
    一種特征加權的模糊緊致散布聚類方法,其特征在于,包括如下步驟:步驟一:設置隸屬度指數m、特征加權指數α∈[?10,?1]∪(1,10]、β∈{0.005,0.05,0.5,1},初始迭代次數p=0以及迭代誤差ε>0,隨機生成初始聚類中心ai,(c為類別數);步驟二:根據下式計算系數ηi:ηi=β4mini≠i′||ai-ai′||2maxt||at-X‾||2]]>其中,為樣本均值;步驟三:根據下式更新樣本隸屬度μij:μij=(Σk=1sωkα(||xij-aik||2-ηi||aik-Xk‾||2))11-mΣt=1c(Σk=1sωkα(||xjk-atk||2-ηt||atk-Xk‾||2))11-m]]>記Δij=Σk=1sωkα(||xij-aik||2-ηi||aik-Xk‾||2)]]>當樣本點xj存在落在硬劃分邊界上時,此時Δij=0,在保證各樣本點相對于第i類的距離尺度不變的前提下,對Δij≥0的根據下式進行調整:Δij=Δij+rand*minj(Δij>0)(j=1,...,n)]]>調整后利用下式計算新的μij:μijΔij11-mΣt=1cΔtj11-m]]>因為有樣本點xj落在第i類硬劃分區域內,所以會有μij<0,因此對μij進行硬劃分調整:μij=1,Δij<0μi′j=0,i′≠i]]>步驟四:根據下式計算特征權重ωk:ωk=(Σi=1cΣj=1nμijm(||xij-aij||2-ηi||aik-Xk‾||2))11-αΣt=1s(Σi=1cΣj=1nμijm(||xjt-ait||2-ηi||ait-Xt‾||2))11-α]]>記Δk=Σi=1cΣj=1nμijm(||xjk-aik||2-ηi||aik-Xk‾||2)]]>若Δk<0,因為ωk∈[0,1],所以需將Δk投影到大于0的區間且保證各樣本的第k個特征參數與第i類的硬劃分區的距離尺度不變,于是利用下式調整Δk:Δk=Δk-mink(Δk)+mink(Δk>0)]]>調整后利用特征權重公式計算新的ωk;步驟五:根據下式計算聚類中心ai:aik=Σj=1nμijm(xij-ηiXk‾)Σj=1nμijm(1-ηi)]]>步驟六:令迭代次數p=p+1,直到maxi|ai'?ai|<ε;否則轉到步驟二;步驟七:將第t次迭代得到的μij輸出,根據即第j個樣本屬于第i類。...

    【技術特征摘要】
    1.一種特征加權的模糊緊致散布聚類方法,其特征在于,包括如下步驟: 步驟一:設置隸屬度指數m、特征加權指數a e [-10, -1] U (I, 10]、β e {0.005, 0.05,0.5,1},初始迭代次數P = O以及迭代誤差ε > O,隨機生成初始聚類中心Bi,6?=! (C為類別數); 步驟二:根據下式計算系數Hi: 2.根據權利要求1所述的特征加權的模糊緊致散布聚類方法,其特征在于:所述樣本隸屬度μ ij和...

    【專利技術屬性】
    技術研發人員:周媛何軍夏景明
    申請(專利權)人:南京信息工程大學
    類型:發明
    國別省市:江蘇;32

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 男人的天堂无码动漫AV| 少妇伦子伦精品无码STYLES | 亚洲AV日韩AV高潮无码专区| 国产精品99久久久精品无码 | 亚洲美免无码中文字幕在线| 麻豆亚洲AV成人无码久久精品| 亚洲AV无码一区二三区| 亚洲AV无码乱码在线观看富二代| 中文字幕日产无码| 中文字幕无码精品亚洲资源网| AV无码久久久久不卡蜜桃| 国产高清不卡无码视频| 少妇人妻无码精品视频app| 亚洲Av无码乱码在线znlu| 亚洲精品无码专区| 无码专区狠狠躁躁天天躁| 成在人线av无码免费高潮喷水| 日韩夜夜高潮夜夜爽无码| 久久男人Av资源网站无码软件| 国产在线拍偷自揄拍无码| 久久久久无码国产精品不卡| 国产成年无码久久久久下载| 无码av免费一区二区三区试看| 丝袜无码一区二区三区| 成人免费无遮挡无码黄漫视频| 毛片免费全部播放无码| 久久av高潮av无码av喷吹| 无码精品一区二区三区| 亚洲熟妇无码八V在线播放| 无码人妻AV免费一区二区三区| 一本加勒比HEZYO无码资源网| 国产精品无码无卡无需播放器| 无码熟妇人妻在线视频| 亚洲中文字幕久久无码| 精品亚洲av无码一区二区柚蜜| 99久久人妻无码精品系列| 激情无码人妻又粗又大中国人 | 亚洲AV成人片无码网站| 最新中文字幕av无码专区| 精品国产一区二区三区无码| 精品久久久久久无码专区不卡|