零、什麼是機器學習
利用計算機從歷史數據中找出規律,並把這些規律用到對未來不確定場景的決策
- 解決的問題:
未來不確定場景的決策 - 怎麼解決問題
利用計算機從歷史數據中挖出的規律來解決問題 - 機器學習要素
- 主體
主體是計算機 - 數據
數據量越大,找出的規律越精準 - 規律
通過算法,找到規律,機器學習系統利用規律自動生成落地方案
- 主體
一、機器學習的源動力
- 從歷史數據中找出規律,把這些規律用到對未來場景的預測與決定;
- 用數據替代專家
- 經濟驅動,數據變現
二、機器學習算法分類
-
分類方法一
- 有監督學習
- 分類算法
- 迴歸算法
- 無監督學習
- 聚類算法
- 半監督學習(強化學習)
- 有監督學習
-
算法分類方法二
- 分類與迴歸
- 聚類
- 標註
- 算法分類方法三
- 生成模型
- 判別模型
三、機器學習常見算法
序號 | 挖掘主題 | 算法 |
---|---|---|
1 | 分類 | C4.5 |
2 | 聚類 | K-Means |
3 | 統計學習 | SVM |
4 | 關聯分析 | Apriori |
5 | 統計學習 | EM |
6 | 鏈接挖掘 | PageRank |
7 | 集裝與推進 | AdaBoost |
8 | 分類 | kNN |
9 | 分類 | Naiive Bayes |
10 | 分類 | CART |
- 其他常見算法
- FP-Growth
- 邏輯迴歸
- RF、GBDT
- 推薦算法
- LDA
- Word2Vector
- HMM、CRF
- 深度學習
機器學習解決問題步驟
- 確定目標
- 業務需求
- 數據
- 特徵工程
- 訓練模型
- 定義模型
- 定義損失函數
- 優化算法
- 模型評估
- 交叉驗證
- 效果評估