目錄
最近兩天收到同學的私信,對於算法中的一些監督學習,無監督學習不是很瞭解,也不知道從何下手,本篇小編就來介紹一下這三者是什麼東西。
本文章節
1、監督學習
2、無監督學習
3、兩者的區別
4、兩者的使用場景
監督學習
監督學習,小編有個簡單的理解方式,按照這個順序來理解
1、有兩撥人,一撥人是好人,一撥是壞人
2、好人的行爲特徵有:扶老奶奶過馬路,撿到一分錢交給警察叔叔,當志願者等等
3、壞人的行爲特徵有:偷東西,搶劫,欺負好人等等
4、有個審判官,根據你的行爲來進行判斷是好人還是壞人
5、新進來一個小夥伴,由於此人經常扶老奶奶過馬路,當志願者等等,因此審判官就把你判斷爲好人
這五點,融入到機器學習裏面,用機器學習的話來說
好人與壞人:標籤
好人或者壞人的行爲:特徵值
審判官:訓練好的模型
新來的小夥伴:未知類別,待打上標籤的數據
這樣子是不是就比較好理解了,機器學習裏面,先根據已有數據進行模型訓練從而得到一個函數,當有新的數據到來的時候,根據這個函數預測結果。
監督學習裏面的訓練集合包含了輸入與輸出,代表着特徵值與標籤值。
在一般情況下,用來訓練的訓練集的標籤都是由業務方來標記,在工作中,最常見的其實就是數據分類了,通過已有的訓練的樣本去訓練得到一個模型,我們會採用K折交叉驗證來進行調參,從而得到參數的局部最優解,再根據這個模型去預測數據。
在監督學些中,最常見的是迴歸與分類,常見的算法有KNN,SVM,隨機森林等
無監督學習
相比於監督學習,無監督學習,其實就是少了這個監督,也就是沒有標籤。
還是那兩撥人,但是這兩撥人沒有實現標記誰是好人,誰是壞人,他們聚在一起,這時候,上帝之手出現了,它讓這些人喜歡幹嘛就去幹吧,不要猶豫,於是乎,好人們開始去扶老奶奶過馬路,壞人們開始去當小偷,上帝之手成功把這兩撥人給分離開來,接着,給他們分別打上標籤:好人,壞人。
這個上帝之手,就是計算機。
無監督學習中,有兩種方法
1、基於概率密度函數直接評估:其實就是根據每一個類別的特徵在空間的分佈情況得到分佈參數,根據這些分佈參數來進行分類。
2、基於數據樣本之間的相似性進行度量的聚類方式:假定每一個類別都有核心(當成黑幫老大來理解),以這個核心的特徵爲標準,把其他樣本的特徵與這個核心的特徵進行比較,當發現這是一類人的時候,就整合在一起好了,這樣子,不同類別就出來了。
這就是聚類,算法中,K-Mean,PCA,很多深度學習的算法,都是無監督學習。
兩者的區別
1、監督學習必須有訓練樣本及測試樣本,對訓練樣本進行訓練得到規律,再用這個規律來運用在測試樣本上;當時無監督學習就不用,一組數據,啥都沒有,直接就扔給計算機,讓它自己算。
2、監督學習必須有標籤,無監督學習不用標籤,讓計算機自己去分類,然後我們人工根據業務情況打上標籤。
兩者的使用場景
這個說簡單也挺簡單,根據業務方來定,如果業務方給了一組數據,然後還告知了類別,那就用監督學習,反着,則用無監督學習。
--END--
作者:溪雲閣
原創作品,抄襲必究。
部分圖片來源網絡,如侵權請聯繫刪除,謝謝!