原创 python EM算法3(IRIS數據集)

1 代碼1 原理大致思路就是把數據建立成k個高斯分佈,EM迭代N次。最後看每個點在哪個高斯分佈的概率最高,就分到那個分佈。 computeOmega函數,用來算第i個樣本屬於第j個分類的概率$\omega_j^{(i)}$$,其中ωj

原创 python講稿7 Bernoulli naive bayes

from numpy import * import jieba import string def loadDataSet(): postingList=[['my', 'dog', 'has', 'flea', 'prob

原创 python EM算法2

1硬幣問題 先看一個拋硬幣問題,如果我們有A和B兩個不均勻硬幣,選擇任意一個硬幣拋10次(這裏我們知道選擇是的哪一個硬幣),共計選擇5次。正面記爲H,背面記爲T。記錄實驗結果,求A和B再拋正面向上的概率? 使用極大似然估計(Maxim

原创 python kmeans圖像分割

原文:https://blog.csdn.net/google19890102/article/details/52911835 一、理論準備 1.1、圖像分割 圖像分割是圖像處理中的一種方法,圖像分割是指將一幅圖像分解成若干互不相交

原创 EM算法系列-三硬幣問題

來自https://www.jianshu.com/p/f4ff48025c52 https://blog.csdn.net/wendaomudong_l2d4/article/details/79005461 1、引言 概率模型有時

原创 EM算法雙硬幣模型的python實現

1 雙硬幣模型 $\quad`假設有兩枚硬幣A、B,以相同的概率隨機選擇一個硬幣,進行如下的拋硬幣實驗:共做5次實驗,每次實驗獨立的拋10次,結果如圖中a所示,例如某次實驗產生了H、T、T、T、H、H、T、H、T、H,H代表正面朝上。

原创 python10講稿 bayes多分類(10類)

import pdb,jieba,string #pdb.set_trace() import os,sys import numpy as np #1 函數定義部分 def textParse2(bigString): st

原创 python講稿6 Multinomial naive bayes

''' Created on Oct 19, 2010 @author: Peter ''' from numpy import * import jieba import string def loadDataSet():

原创 感知器

學習率 $\eta$學習率($0<\eta<1$) 學習率太大,容易造成權值調整不穩定 學習率太小,權值調整太慢,迭代次數太多 收斂條件 1 誤差小於某個預先設定的較小的值 2 兩次迭代之間的權值變化已經很小 3 設定最大迭代

原创 python講稿8 Gaussian bayes

高斯模型 1. 通過一個例子來說明 下面是一組人類身體特徵的統計資料。 當特徵是連續變量的時候,運用多項式模型就會導致很多(不做平滑的情況下),此時即使做平滑,所得到的條件概率也難以描述真實情況。所以處理連續的特徵變量,應該採用高斯模

原创 python9講稿 bayes多分類(3類)

import pdb,jieba,string #pdb.set_trace() import os,sys import numpy as np #1 函數定義部分 def textParse2(bigString): st

原创 python11講稿 bayes+tfidf多分類(2類)

import pdb,jieba,string #pdb.set_trace() import os,sys import numpy as np #1 函數定義部分 def textParse2(bigString): st

原创 python EM算法4(身高體重數據集)

1 處理數據 import numpy as np # 預處理數據 def loadData(filename): dataSet = [] fr = open(filename) for line in fr

原创 linear regression1

一元線性迴歸是數據挖掘的基礎模型,其中包含了非常重要的數學回歸的概念,是學習多元迴歸,廣義線性迴歸的基礎。本文主要講解1)基礎原理2)數學推導3)R語言演示,來介紹一元線性迴歸。 整體思路: 根據已知點求一條直線,希望直線與各個點距離

原创 linear regression2

1 多元線性迴歸的矩陣解法 令J(θ)=12M∑i=1n(yi−(a+bxi))2=12M(y−xθ)T(y−xθ)J(\theta)=\frac{1}{2M}\sum\limits_{i=1}^n(y_i-(a+bx_i))^2=\