《電子技術應用》
您所在的位置:首頁 > 其他 > 設計應用 > 基于減法聚類改進的模糊c-均值算法的模糊聚類研究
基于減法聚類改進的模糊c-均值算法的模糊聚類研究
來源:微型機與應用2010年第16期
于 迪1, 李義杰2
(1. 遼寧工程技術大學 研究生學院,遼寧 葫蘆島 125105;2. 遼寧工程技術大學 軟件學院
摘要: 針對模糊c-均值(FCM)聚類算法受初始聚類中心影響,易陷入局部最優,以及算法對孤立點數據敏感的問題,提出了解決方案:采用快速減法聚類算法初始化聚類中心,為每個樣本點賦予一個定量的權值,用來區分不同的樣本點對最終的聚類結果的不同作用,為提高聚類速度采用修正隸屬度矩陣的方法,并將算法與傳統的FCM相比。實驗結果表明,該算法較好地解決了初值問題,與隨機初始化方法相比,迭代次數少、收斂速度快、具有較好的聚類結果。
Abstract:
Key words :

摘   要: 針對模糊c-均值(FCM)聚類算法受初始聚類中心影響,易陷入局部最優,以及算法對孤立點數據敏感的問題,提出了解決方案:采用快速減法聚類算法初始化聚類中心,為每個樣本點賦予一個定量的權值,用來區分不同的樣本點對最終的聚類結果的不同作用,為提高聚類速度采用修正隸屬度矩陣的方法,并將算法與傳統的FCM相比。實驗結果表明,該算法較好地解決了初值問題,與隨機初始化方法相比,迭代次數少、收斂速度快、具有較好的聚類結果。
關鍵詞: 模糊c-均值; 減法聚類; 權值

    模糊聚類作為無監督機器學習的主要技術之一,廣泛應用于數據挖掘、矢量量化、圖像分割、模式識別、醫學診斷等領域。引入模糊數學方法,通過建立數據樣本類屬的不確定描述,將相似性質的事物分開并加以分類,能比較客觀地反映現實世界。
    模糊c-均值(FCM)算法是模糊聚類的基本方法之一,它是一種聚類不定歸屬的方法。它通過引入隸屬度函數來表示每個樣本點屬于各個類別的程度,從而決定樣本點的類屬,對數據進行軟劃分。
    FCM算法就是通過搜索目標函數的最小點,反復修改聚類中心矩陣和隸屬度矩陣的分類過程。目前算法的收斂性已得到證明[1],但它是一種局部搜索算法,對初值的選取十分敏感,如果初值選取不當,它容易收斂到局部極小點。且FCM對孤立點數據、樣本分布不均衡也很敏感。鑒于此,提出基于減法聚類的改進的模糊c-均值聚類,使得算法的收斂速度和準確性都得以改善。
1 模糊c-均值算法分析


2 基于減法聚類的改進的模糊c-均值算法
2.1初始聚類中心的選擇

    減法聚類是一種爬山法,它把所有的樣本點作為聚類中心的候選點,其基本思想是計算每個樣本點的密度指標,如果該樣本點周圍的點多,則密度指標就大,就選取密度指標最大的樣本點作為聚類中心。減法聚類是一種快速獨立的近似的聚類方法,用它計算,計算量由樣本數目決定且與樣本點的數目成簡單的線性關系,而且與所考慮問題的維數無關。


    (2) 修正隸屬度矩陣
    FCM算法的思想是:迭代調整隸屬矩陣和聚類中心使目標函數值最小,為保證FCM算法每次的迭代都朝著全局最優的方向逼近,其關鍵就在于保證確定V的下一次迭代值,加快收斂于全局最優點的速度。在此采用修正隸屬矩陣來計算下一次迭代的聚類中心,使得到的V更靠近聚類中心,更合理,從而提高FCM算法的收斂速度。因此修正隸屬度矩陣[5]可以提高聚類速度,使聚類效果更好。
    樣本離聚類中心距離越遠屬于該聚類中心的程度越小,反之越大,樣本對類中心的影響即稱為樣本對類中心施加的吸引力,在這里設定了一個抑制因子,由它來控制對離樣本點次最近的類中心的抑制作用。
    當α=1時,算法退化為FCM算法,對離樣本點次最近的類中心沒有任何抑制作用。
    當α=0時,算法完全抑制了樣本對離它次最近類中心的吸引力,對離樣本最近類中心的吸引力的增強力度最大。
    當1<α<0時,算法對離樣本次最近類中心的吸引力有一定的抑制作用,對離樣本最近類中心的吸引力有一定的增加作用。
    修正隸屬度矩陣的過程如下:
  
    (5) 判斷是否終止迭代。終止而退出,否則,L=L+1,返回步驟(2),繼續迭代。
    經過對隸屬度矩陣的修正可知:改進后的算法,樣本點增大了對離它最近的類中心的吸引力強度;樣本點減小了對離它次最近的類中心的吸引力強度,從而減弱了離樣本次最近類中心對離樣本最近的類中心收斂速度的延緩作用。對其余類中心的吸引力強度不變,從而提升了FCM算法的收斂速度。
2.3 基于減法聚類改進的模糊c-均值算法過程
    為保證改進的FCM聚類結果為全局最優解,采用減法聚類的聚類中心作為改進的FCM聚類的初始聚類中心。算法步驟如下:
    (1) 設定聚類參數:領域的半徑ra、rb,比例參數δ,FCM聚類數c,模糊指數m和最小誤差ε,迭代次數L,吸引力抑制因子α。
    (2) 應用式(4)計算所有樣本點的密度指標,將密度指標最高的一個作為第一個聚類中心點xc1。
    (3) 依據公式(5)利用減法步驟(2)中的xc1進一步計算余下的n-1個數據點的密度指標,找出最高的作為第二個聚類中心xc2,依此類推,找到p個聚類中心,從中選取前c個作為FCM的初始聚類中心v(0)。
    減法聚類中心中,密度指標越大的聚類中心出現得越早,越有可能成為改進的FCM初始聚類中心。所以,當聚類數為c時,取減法聚類產生的前c個聚類中心作為改進的FCM的初始中心,無須再重新初始化,從而提高了聚類的效率。
    (4) 求式(10)的最小值
    (5) 按式(11)和式(12)計算出隸屬度U(L)
    (6) 依據式(13)和式(14)修正隸屬度矩陣U(L)。
    (7) 依據式(15),用修正后的U(L)計算下一次的迭代中心V(L+1)。
    (8) 判斷是否滿足終止迭代條件。對給定的閾值,
‖U(L+1)-U(L)‖<ε如果終止而退出,否則,L=L+1,返回步驟(5),繼續迭代。
3 仿真與結果分析


    

    從圖1、圖2與表1中可以看出,傳統FCM與本文中的算法相比迭代次數少、搜索速度更快、聚類平均準確率更高。

    基于減法聚類的改進的FCM算法很好地解決了FCM算法對初始值敏感及易陷入局部最優的問題,同時也改善了FCM對孤立點敏感的問題,提高了聚類的速度,具有很高的實用價值。
參考文獻
[1]  GAMES R A, CHAN A H. A fast algorithm for determining the linear complexity of a pseudorandom sequence with period 2n[J].IEEE Trans Inf Theory ,1983,IT-29(1):144-146.
[2]  HAND D, MANNILA H, SMYTH P. Principles of data mining [M].Cambridge MA:MITPress,2001.
[3]  PAL N R, CHAKRABORTY D. Mountain and subtractive clustering method; Improvements and Generalization. International Journal of Intelligent Systems , 2000,15 (4):329-341.
[4]  齊淼,張化祥.改進的模糊c-均值聚類算法研究[J].計算機工程與應用,2009,45(20).
[5]  閆兆振.自適應模糊c-均值聚類算法研究[D]. 濟南:山東科技大學,2006.

此內容為AET網站原創,未經授權禁止轉載。
主站蜘蛛池模板: 美女黄网站全是免费网址 | 欧美xxx在线观看4k | 亚洲国产成人久久77 | 免费日韩在线 | www.深夜福利 | 成年视频免费观看 | 一级片视频免费 | 国产日韩精品欧美一区喷水 | 色性视频 | 免费人成视网站在线不卡 | 欧美freesex呦交6_10 | 五月婷婷开心网 | 香蕉视频网站在线 | 久久成人免费观看全部免费 | 亚洲人成小说色在线 | 最近更新在线中文字幕一页 | 五月天毛片 | 小明www永久免费播放平台 | a级人体片免费观看网站 | 香蕉99国内自产自拍视频 | 韩国午夜理伦三级在线观看仙踪林 | 视频精品一区二区三区 | 一区二区网站在线观看 | 欧美在线a| 黄色的网站在线观看 | jizz国产丝袜18老师女人 | 欧美日本一道免费一区三区 | 国产三级国产精品 | 在线免费观看a视频 | 99久在线精品99re6视频 | 欧美片在线 | 日韩精品一区二区三区中文 | 一级做a爰片久久毛片武则天 | 日本一区二区在线不卡 | 国产爱v| 亚洲第一视频网 | 中文字幕视频一区二区 | 成人午夜免费福利视频 | 欧美成人手机视频免费播放 | 国产成人啪精品视频免费软件 | 免费国产成人高清无线看软件 |