機器學習的分類
- 監督學習
提供數據並提供數據對應結果的機器學習過程 - 無監督學習
提供數據並不提供數據對應結果的機器學習過程 - 強化學習
通過與環境的交互並獲取延遲返回進而改進行爲的學習過程
無監督學習
定義:我們不知道數據集中數據、特徵之間的關係,而是要根據分組或聚類或一定的模型得到數據之間的關係。
可以這麼說,比起監督學習,無監督學習更像是自學,讓機器學會自己做事情,是沒有標籤(label)的。
無監督學習應用
Google新聞按照內容結構的不同分成財經,娛樂,體育等不同的標籤,這就是無監督學習中的聚類。
監督學習
定義:根據已有的數據集,知道輸入和輸出結果之間的關係。根據這種已知的關係,訓練得到一個最優的模型。也就是說,在監督學習中訓練數據既有特徵(feature)又有標籤(label),通過訓練,讓機器可以自己找到特徵和標籤之間的聯繫,在面對只有特徵沒有標籤的數據時,可以判斷出標籤。
- 監督學習的分類:迴歸(Regression)、分類(Classification)
- 當輸出被限制爲有限的一組值(離散數值)時使用分類算法
- 當輸出可以用具體範圍內的任何數值(連續數值)時使用迴歸算法
相似度學習是和迴歸和分類都密切相關的一類監督機器學習,它的目標是使用相似度函數從樣本中學習。
監督學習的應用
預測房價或者房屋售出情況