聚類分析(二)——二分K均值

一般的K均值,所分成的簇往往是局部最優,而不是全局最優,比如下圖,簇也不會再更新了,但顯然沒達到我們的要求。
在這裏插入圖片描述
算法思想:

顧名思義,二分k均值就是每次將數據集一分爲二,即k均值算法中的k值爲2,第一次是在整個數據集上劃分,這裏沒什麼異議,從第二次開始,每次劃分的時候就要選取使整個數據集誤差平方和最小的一個類進行一分爲二了,以此進行下去直到分成我們想要的k類。

二分k均值的僞代碼如下:

將所有點看成一個類別
當類別數小於k時
對每一個類
計算總的誤差平方和
在當前類內進行k均值聚類,k的值爲2
計算將該類一分爲二後總的誤差平方和
選擇使得總的誤差平方和最小的劃分類進行劃分

參考:https://blog.csdn.net/ReXueLaoNanHai/article/details/80908522

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章