原创 數據挖掘算法04 - SVM

SVM SVM 的英文叫 Support Vector Machine,中文名爲支持向量機。它是常見的一種分類方法,在機器學習中,SVM 是有監督的學習模型。 什麼是有監督的學習模型呢?它指的是我們需要事先對數據打上分類標籤,這樣

原创 數據挖掘算法03 - CART

CART CART 算法 另一種常見的決策樹是 CART 算法(Classification and Regression Trees,分類與迴歸樹)。這種算法和 ID3、C4.5 相比,主要有兩處不同: 在分類時,CART

原创 數據挖掘算法09 - Apriori

Apriori 關聯規則挖掘可以讓我們從數據集中發現項與項(item 與 item)之間的關係,它在我們的生活中有很多應用場景,“購物籃分析”就是一個常見的場景,這個場景可以從消費者交易記錄中發掘商品與商品之間的關聯關係,進而通過

原创 數據挖掘算法01 - NB

Naive Bayes 概率和統計裏有哪些需要掌握的概念? 隨機變量(Random Variable)來描述事件所有可能出現的狀態 離散型隨機變量(Discrete Random Variable) 連續型隨機變量(Cont

原创 數據挖掘算法08 - EM

EM EM 的英文是 Expectation Maximization,所以 EM 算法也叫最大期望算法。 例子 分菜 拋硬幣 EM 聚類三步驟 你能從這個例子中看到三個主要的步驟:初始化參數、觀察預期、重新估計。首先

原创 數據挖掘算法06 - Adaboost

Adaboost 今天我們學習 AdaBoost 算法。在數據挖掘中,分類算法可以說是核心算法,其中 AdaBoost 算法與隨機森林算法一樣都屬於分類算法中的集成算法。 集成算法的兩種模式 集成的含義就是集思廣益,博取衆長,

原创 機器學習算法04 - 邏輯迴歸

邏輯迴歸 機器學習基本算法之一的邏輯迴歸方法的基本原理,其要點如下: 邏輯迴歸模型是對線性迴歸的改進,用於解決分類問題; 邏輯迴歸輸出的是實例屬於每個類別的似然概率,似然概率最大的類別就是分類結果; 在一定條件下,邏輯迴歸模