文章純屬個人愚見,歡迎指正!
分類:分類就是通過一些學習(監督學習),弄錯一個分類器或者說分類模型,當你把一個參數(數據)放入時,可以告訴你你這參數(數據)應該放到哪個類,類似於貓狗分類。
一:樸素貝葉斯(Naive Bayes, NB)
http://www.ruanyifeng.com/blog/2011/08/bayesian_inference_part_one.html
二:Logistic迴歸(Logistic Regression, LR)
https://blog.csdn.net/qq_20073741/article/details/102647497
三:決策樹(Decision Tree, DT)
基本術語:
- 根節點(Root Node):它代表整個種羣或樣本,並進一步分爲兩個或更多個同類集。
- 拆分(Splitting):這是將節點劃分爲兩個或更多個子節點的過程。
- 決策節點(Decision Node):當子節點分裂成更多的子節點時,它被稱爲決策節點。
- 葉子/終端節點(Leaf/ Terminal Node):不分割的節點稱爲葉子或終端節點。
- 修剪(Pruning):當我們刪除決策節點的子節點時,此過程稱爲修剪。 你可以說相反的分裂過程。
- 分支/子樹(Branch / Sub-Tree):整個樹的子部分稱爲分支或子樹。
- 父節點和子節點(Parent and Child Node):劃分爲子節點的節點稱爲子節點的父節點,其中子節點是父節點的子節點。
https://blog.csdn.net/qq_39384184/article/details/79940305
四:隨機森林(Random Forest, RF)
https://blog.csdn.net/qq_20073741/article/details/103537438
五:支持向量機(Support Vector Machine, SVM)
特點:數據量少
分類算法評估指標:
(1)分類準確度
(2)召回率
(3)虛警率
(4)精確度