【技術實現步驟摘要】
本專利技術屬于數據處理
,尤其是涉及。
技術介紹
在自然科學和社會科學中,存在著大量的分類問題,聚類方法是研究(樣品或指標)分類問題的一種統計分析方法,同時也是數據挖掘的一個重要算法,應用領域非常廣泛。模糊C-均值(FCM)聚類算法是常用的無監督模式識別方法,有很多對FCM算法的改進,其中基于特征加權的FCM(WFCM)聚類算法考慮了樣本各特征參數對聚類中心的影響,改善了噪聲、異常數據影響等情況。但是,這些基于FCM的聚類算法,實質都只考慮了樣本的類內緊致性(類內散度),而忽略了樣本類間散布性(類間散度)。Kuo-Lung Wu等人提出的FCS (Fuzzy Compactness and Separation)算法考慮了類內緊致和類間散布,并兼容了樣本的硬劃分和模糊劃分,這更符合實際情況;國內有宋風溪等人提出了最大散度差判別準則的分類方法,該準則綜合考慮類間散度和類內散度來求最優投影向量以對樣本進行分類;皋軍等人將模糊度引入了最大散度差判別準則提出了 FMSDC(fuzzy maximum scatterdifference discriminant criterion)算法,在模糊聚類的同時進行了降維;支曉斌等人指出皋軍等人的算法中的錯誤,提出FMSDC-FCS聚類算法,該算法是皋軍等人算法的正確版本,利用FCM算 法初始化隸屬度和樣本均值,再用FMSDC算法進行降維,用FCS算法對降維數據進行聚類,其聚類實質還是采用FCS算法。而在利用上述算法進行數據分類的過程中,我們發現,實際數據有些處于某類硬劃分區域和硬劃分邊界上,這些數據的 ...
【技術保護點】
一種特征加權的模糊緊致散布聚類方法,其特征在于,包括如下步驟:步驟一:設置隸屬度指數m、特征加權指數α∈[?10,?1]∪(1,10]、β∈{0.005,0.05,0.5,1},初始迭代次數p=0以及迭代誤差ε>0,隨機生成初始聚類中心ai,(c為類別數);步驟二:根據下式計算系數ηi:ηi=β4mini≠i′||ai-ai′||2maxt||at-X‾||2]]>其中,為樣本均值;步驟三:根據下式更新樣本隸屬度μij:μij=(Σk=1sωkα(||xij-aik||2-ηi||aik-Xk‾||2))11-mΣt=1c(Σk=1sωkα(||xjk-atk||2-ηt||atk-Xk‾||2))11-m]]>記Δij=Σk=1sωkα(||xij-aik||2-ηi||aik-Xk‾||2)]]>當樣 ...
【技術特征摘要】
1.一種特征加權的模糊緊致散布聚類方法,其特征在于,包括如下步驟: 步驟一:設置隸屬度指數m、特征加權指數a e [-10, -1] U (I, 10]、β e {0.005, 0.05,0.5,1},初始迭代次數P = O以及迭代誤差ε > O,隨機生成初始聚類中心Bi,6?=! (C為類別數); 步驟二:根據下式計算系數Hi: 2.根據權利要求1所述的特征加權的模糊緊致散布聚類方法,其特征在于:所述樣本隸屬度μ ij和...
【專利技術屬性】
技術研發人員:周媛,何軍,夏景明,
申請(專利權)人:南京信息工程大學,
類型:發明
國別省市:江蘇;32
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。