引言
GMM理論上可以擬合出任意類型的分佈。
博客是一份筆記,詳細的講解可以看[1]
GMM
GMM的應用
常用於聚類【實際上可以分爲兩步:首先隨機地在這 K 個 Component 之中選一個,每個 Component 被選中的概率實際上就是它的係數πk ,選中 Component 之後,再單獨地考慮從這個 Component 的分佈中選取一個點就可以了──這裏已經回到了普通的 Gaussian 分佈,轉化爲已知的問題。】
將GMM用於聚類時,假設數據服從混合高斯分佈(Mixture Gaussian Distribution),那麼只要根據數據推出 GMM 的概率分佈來就可以了;然後 GMM 的 K 個 Component 實際上對應K個 cluster 。根據數據來推算概率密度通常被稱作 density estimation 。特別地,當我已知(或假定)概率密度函數的形式,而要估計其中的參數的過程被稱作『參數估計』。
參數估計過程
最大似然估計法:
文獻引用: