Difference between 分類and聚類
A:
分類 | 聚類 | |
---|---|---|
是否監督 | 有監督學習 | 無監督學習 |
任務 | find模型,數據標籤一一對應 | 相似的數據聚在一起 |
數學類比 | 已知x,y求f | 已知x,求f |
分類
是機器學習中的一項非常重要的任務,利用分類技術可以從數據集中提取描述數據類的一個函數或模型(也常稱爲分類器),並把數據集中的每個對象歸結到某個已知的對象類中。
從某種意義上講數據挖掘的目標就是根據樣本數據形成的模型並對源數據進行分類,進而也可以預測未來數據的歸類。
分類和迴歸都可以用於預測,兩個的目的都是從歷史數據記錄中建立模型,從而可以對未來數據進行預測,.
那麼分類和迴歸應怎樣區分呢?
具體區分細節可以點擊我的主頁查看其他blog,在這裏只做大概描述:
與迴歸不同,分類的輸出是離散的類別值,迴歸輸出的是連續的數值.
從直觀上感覺,聚類的難度是要大於分類的難度的.
聚類
- 與分類技術不同,在機器學習中,聚類是一種無監督學習。也就是說,聚類是在預先不知道欲劃分類的情況下,根據信息相似度原則進行信息聚類的一種方法。
- 聚類的目的是是的屬於同一類別的對象之間的差別儘可能的小,不同類別上的對象差別儘可能的大.
有監督學習
訓練數據包括本身數據和所屬類別
常見算法:邏輯迴歸算法,SVM,大熱的深度學習.
無監督學習
訓練樣本只有本身的數據,只能通過數據特徵的相似度對樣本進行聚類.
常見算法:K-means算法,DBSCAN算法.