聚類算法之Kmeans

Kmeans是聚類算法中比較簡單的算法,也用的非常多。這裏進行簡單的解釋,主要目的在於給自己記錄,以備以後查看。

K均值聚類的主要思想是爲了使得各個類的點離聚類中心都儘可能近。

K均值聚類的算法可以描述爲:


輸入:數據集D={x1,x2,..,xn}
聚類簇個數:k


算法:

  1. 從數據集D中隨機選擇k個樣本作爲初始聚類中心{u1,u2,...,uk}
  2. repeat
  3. Ci=(1ik)
  4. for j = 1,2,…,m do
  5. for l = 1,2,…,n
  6. 計算樣本l 和每個聚類中心的距離,並把樣本l加入到距離最近的聚類中心所屬的集合中
  7. end for
  8. end for
  9. 重新計算所有聚類簇的中心位置,即均值向量
  10. until 聚類中心不再變化(有時候收斂時間很長,可能會設置一個最大重複次數,或是設置聚類中心的變化閾值ϵ

輸出:聚類簇{C1,C2,...,Ck}


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章