【技術實現步驟摘要】
本專利技術涉及聚類分析
,尤其涉及一種可能模糊K調和均值聚類方法及系 統。
技術介紹
聚類是一種無監督學習方法,它尋找數據之間的相互聯系,按照相似性原則進行 分類,就是“物以類聚”。聚類廣泛應用于模式分類,文本信息提取,圖像分割和數據挖掘等 領域。K-均值聚類是著名的聚類方法之一,給定一個數據集和聚類數目k,K-均值聚類能 簡潔有效地劃分數據集。但是,K-均值聚類的聚類結果依賴于初始聚類中心的選擇,不同 的初始聚類中心會導致不同的聚類結果,所以,K-均值聚類對初始聚類中心敏感而導致聚 類結果不穩定。另外,K-均值聚類容易陷入局部極小點。1999年Zhang等人提出K調和均值聚類,是一種基于中心的迭代聚類方法。K調 和均值聚類將所有數據點到每個聚類中心的調和平均值的和作為聚類的目標函數。實驗表 明,由于提升函數的作用使K調和均值聚類對初始聚類中心不敏感。但是,K調和均值聚類 也容易陷入局部極小點。因此,許多學者針對此問題展開研究。Yang等人將粒子群優化和 K調和均值聚類相結合,提出一種粒子群優化的K調和均值聚類方法(PSOKHM),PSOKHM能避 免局部極小點,并且解決了粒子群優化收斂速度慢問題。由于蟻群聚類方法能解決局部極 小點問題,Jiang等人提出一種基于蟻群聚類的K調和均值聚類方法。在給定初始溫度值后 模擬退火用來搜尋一些空間分子的平衡狀態,它是一種求解組合優化問題的方法。和Ctaler在模擬退火和K調和均值聚類基礎上提出一種新的聚類算法以求得K調和均值聚 類的全局最優解。禁忌搜索是一種全局逐步尋優算法,Gitagfir和利用禁忌搜索方法 ...
【技術保護點】
一種可能模糊K調和均值聚類方法,其特征在于,所述方法包括以下步驟:S1、確定聚類的初始類中心;S2、設置聚類算法的參數值;S3、計算樣本數據的協方差;S4、計算可能模糊K調和均值聚類的模糊隸屬度值;S5、計算可能模糊K調和均值聚類的典型值;S6、計算可能模糊K調和均值聚類的聚類中心值;S7、判斷是否滿足迭代終止條件,若滿足則迭代終止,若不滿足則返回步驟S3~S6繼續進行迭代計算;S8、利用模糊隸屬度值和典型值最終實現數據集的劃分。
【技術特征摘要】
1.一種可能模糊K調和均值聚類方法,其特征在于,所述方法包括以下步驟 51、確定聚類的初始類中心; 52、設置聚類算法的參數值; 53、計算樣本數據的協方差; 54、計算可能模糊K調和均值聚類的模糊隸屬度值; 55、計算可能模糊K調和均值聚類的典型值; 56、計算可能模糊K調和均值聚類的聚類中心值; 57、判斷是否滿足迭代終止條件,若滿足則迭代終止,若不滿足則返回步驟S3 S6繼續進行迭代計算; 58、利用模糊隸屬度值和典型值最終實現數據集的劃分。2.根據權利要I所述的可能模糊K調和均值聚類方法,其特征在于,所述步驟S2具體為確定類別數k,數據的個數n和權重指數m和q的值,且滿足n>k彡2, + >m, q>l ;設置迭代次數初始值r=l和最大迭代次數為設置迭代最大誤差參數e ;設置常數a和b的值。3.根據權利要I所述的可能模糊K調和均值聚類方法,其特征在于,所述步驟S3中樣本數據的協方差計算公式為 ,IjrZ-^If,其中J = 士,xj為第j個樣本數據,F為樣本均值,。2為樣本數據的協方差。4.根據權利要I所述的可能模糊K調和均值聚類方法,其特征...
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。