EM&GMM大作業

EM&GMM大作業

*注:本設計基於MATLAB2016b來實現
*
大作業要求:
內容要求1:首先自己構造由3個甚至多個二維高斯分佈組成的GMM並生成大量數據點,其次根據這些數據點進行基於EM算法的GMM參數估計(構建幾個分佈則K爲幾),將所估計的均值在迭代中的運動軌跡繪製在圖上。
內容要求2:尋找並下載“The old faithful dataset”,將尋找的過程以及數據來源寫在報告中。對其使用基於EM算法的GMM參數估計(K=2),並把高斯分佈均值在迭代中的運動軌跡繪製在數據圖上
內容要求3:尋找並下載“The Iris Dataset”,將尋找的過程以及數據來源寫在報告中。使用所有數據樣本的其中2個維度進行基於EM算法的GMM參數估計(K=3),並把均值在迭代中的運動軌跡繪製出來。
思考題1:在前兩頁PPT中出現的橢圓形等高虛線上高斯分佈的概率密度其實處處相等。1.請證明:這些等高線符合橢圓方程。2. 請附上生成這些等高線的代碼,並使用代碼把之前計算出的高斯分佈的邊緣用等高線繪製出來.
思考題2:
1.自己尋找、構建、或者向自己的導師(授權)尋求一個複雜數據集(數據點大於300個),其中要求每個數據點的維度>=3。
2.請在這個數據集上使用基於EM迭代的GMM方法估計GMM參數並將最後的數據聚類結果進行展示(請採用一種直觀有效的展示方法)。
3. 請在這個數據集上使用另一種聚類方法(可以是無監督的、半監督的、也可以是有監督的),或是其他數據劃分算法,實現聚類結果並展示。
**

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章