k-means與EM算法小結

原創

努力是一种幸运

2020-06-20 00:39

EM算法像是k-means的應用場景，比如雙峯分佈的數據，k-means方法，將其看成2-means聚類的方法處理場景。

k-means算法，也被稱爲k-平均或k-均值，是一種廣泛使用的聚類算法，或者成爲其他聚類算法的基礎。

假定輸入樣本爲，則算法步驟爲：

（1）選擇初始的k個簇中心u1,u2,...,uk

（2）將樣本xi標記爲距離簇中心最近的簇：

（3）更新簇中心：

（4）重複最後兩步，直到滿足終止條件。（迭代次數/簇中心變化率/最小平方誤差MSE）

思考：經典的K-means聚類方法，能夠非常方便的將未標記的樣本分成若干簇；但無法給出某個樣本屬於該簇的後驗概率。

從直觀理解猜測GMM的參數估計

隨機變量X是有K個高斯分佈混合而成，取各個高斯分佈的概率爲，第i個高斯分佈的均值爲。若觀測到隨機變量X的一系列樣本，試估計參數。

建立目標函數

由於在對數函數裏面又有加和，我們沒法直接用求導解方程的辦法直接求得極大值。分成兩步。

第一步：估算數據來自哪個組份

估計數據由每個組份生成的概率，對於每個樣本xi，它由第k個組份生成的概率爲。

上式中的也是待估計的值，因此採樣迭代法：在計算。但是（1）需要先驗給定；（2）亦可看成組份k在生成數據xi時所做的貢獻。

第二步：估計每個組份的參數

對於所有的樣本點，對於組份k而言，可看做生成了這些點。組份k是一個標準的高斯分佈。

EM算法的提出

（1）假定有訓練集包含m個獨立樣本，希望從中找到該組數據的模型P(x,z)的參數。

（2）取對數似然函數

其中z是隱隨機變量，不方便直接找到參數估計。策略：計算下界，求該下界的最大值；重複該過程，直到收斂到局部最大值。

（圖像摘自七月算法）

（3）Jensen不等式。令Qi是z的某一個分佈，Oi》0，有：

（圖像摘自七月算法）

（4）爲了使等號成立

（5）進一步分析

（6）EM算法整體框架

從理論公式推導GMM

（1）隨機變量X是有K個高斯分佈混合而成，取各個高斯分佈的概率爲，第i個高斯分佈的均值爲ui，方差爲。若觀測到隨機變量X的一系列樣本，試估計參數。

（2）E-step

M-step

將多項分佈和高斯分佈的參數帶入

（3）對均值求偏導

令上式等於0，解出均值

同理，求偏導，等於0，得到高斯分佈的方差

（4）多項分佈的參數。

考察M-step的目標函數，對於，刪除常數項。則

（5）拉格朗日乘子法

由於多項分佈的概率和爲1，建立拉格朗日方程

這樣求解的一定非負，所以，不用考慮》0這個條件

求偏導，等於0

（6）回到（2）E-step繼續迭代，直到達到局部最優值

帶有隱變量，往往可以用EM算法來求解。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

CART實現

基於R的CART的實現包有tree,rpart. tree rpart

2020-07-07 22:26:30

Ridge regression

參考文獻 1.Hoerl A E, Kennard R W. Ridge regression: Biased estimation for nonorthogonal problems[J]. Technometrics, 19

2020-07-07 22:26:30

Python實現kd樹

kd樹的數據結構和二叉樹類似，每個節點存有當前節點的數值，左右子樹的節點，和以當前節點爲根節點的子樹的劃分維度。 class KdNode: def __init__(self, dim, val, left=None, ri

2020-07-07 00:33:04

PCA方法Python代碼實現

關於PCA方法的原理這裏就不介紹了，網絡上很多文章寫得都很好，這裏給出以三維點集的PCA爲例，在python裏實現PCA方法。 PCA方法的主要步驟是：數據中心化計算協方差矩陣根據協方差矩陣計算出特徵值和特徵向量 python代碼如

2020-07-07 00:33:04

hadoop 簡單入門與streaming常用配置參數說明

1. Hadoop包含兩核心部分 hdfs Hadoop distribute file system -- hadoop分佈式文件系統，存儲數據 Namenode、Datanode 常用命令形式：hadoop fs -ls / h

2020-07-06 23:19:09

假設空間版本空間&查全率查準率

一、假設空間版本空間根據P4表1.1和P5圖1.1得，假設空間爲： 1 色澤＝＊，根蒂＝＊，敲聲＝＊2 色澤＝青綠，根蒂＝＊，敲聲＝＊3 色澤＝烏黑，根蒂＝＊，敲聲＝＊4 色澤

liangyingyi1006

2020-07-04 10:41:01

Transformers與圖神經網絡的關係，我們能從transformer學習到什麼？

1、導讀這個觀點的目的是構建Transformer結構背後的NLP上的直覺，以及與圖神經網絡的聯繫。圖深度學習”聽起來很厲害，但有什麼大的商業成功的故事嗎？它有沒有被部署在實際app中？除了Pinterest、阿里巴巴和Tw

BUAA～冬之恋

2020-07-04 03:47:48

機器學習——分類算法之決策樹

機器學習——分類算法之決策樹前言1、信息熵2、條件熵ID3算法C4.5決策樹CART決策樹1、CART決策樹的分類算法2、CART決策樹的迴歸算法剪枝1、預剪枝2、後剪枝連續值和缺失值的處理1、連續值的處理2、缺失值的處理前言

2020-07-03 16:48:56

機器學習——分類算法之感知機

機器學習——分類算法之感知機前言符號函數感知機模型感知機算法1、原始形式2、對偶形式代碼前言感知機算法（perceptron）是用於二分類的線性分類模型，將輸入實例劃分爲正例和負例的一個超平面，屬於判別模型。感知機算法旨在求出

2020-07-03 16:10:50

機器學習——貝葉斯算法和樸素貝葉斯算法

機器學習——分類算法之貝葉斯算法和樸素貝葉斯算法前言一、貝葉斯算法算法示例二、樸素貝葉斯分類器1、貝葉斯決策論2、多元正太分佈參數的極大似然估計3、樸素貝葉斯分類器前言這部分的公式推導較多，涉及到了極大似然估計和貝葉斯估計，要

2020-07-03 16:10:50

機器學習——分類算法之邏輯迴歸

機器學習——分類算法之邏輯迴歸前言邏輯迴歸(Logistic Regression)1、Sigmoid函數2、算法推導3、代碼前言邏輯迴歸也被稱爲對數機率迴歸，注意這裏面說的迴歸並不是真正意義上的迴歸算法，其實它是一個經典的分

2020-07-03 16:10:50

邏輯迴歸解決多分類問題

邏輯迴歸解決多分類問題第一種方式：從類別入手1、OVO(one vs one)2、OVR(One Vs Rest)第二種方法：從算法入手傳統的邏輯迴歸只能處理二分類問題，對於多分類任務，主要有如下兩種方案。第一種方式：從類別入

2020-07-03 16:10:50

機器學習---線性迴歸算法梳理

線性迴歸算法梳理任務1 - 線性迴歸算法梳理一、基本概念二、線性迴歸的原理三、線性迴歸損失函數、代價函數、目標函數四、優化方法(梯度下降法、牛頓法、擬牛頓法等)五、線性迴歸的評估指標六、sklearn參數詳解任務1 - 線性迴歸

2020-07-03 16:09:47

windows系統下python快速註釋多行

以下才做適合於Windows系統。除了對每一行前面添加#的註釋方式外（如若要註釋多行，這種方式較慢），我們還可以考慮另外兩種註釋方式： 1、Ctrl + / （先選中要註釋的代碼，再按Ctrl + /） 2、用’’’ ‘’'或者

2020-07-03 16:09:36

隱馬爾科夫模型HMM（三）鮑姆-韋爾奇算法求解HMM參數

文章目錄HMM模型參數求解概述鮑姆-韋爾奇算法的推導鮑姆-韋爾奇算法流程總結 HMM模型參數求解概述 HMM模型參數求解根據已知的條件可以分爲兩種情況。第一種情況較爲簡單，就是我們已知D個長度爲T的觀測序列和對應的隱藏狀態序列，

2020-07-03 13:01:58

24小時熱門文章

最新文章

最新評論文章