機器學習第一講

機器學習課程包括四個部分:

第一:監督式學習(supervised learning),有兩種類型:迴歸和分類。採集了某地區的房屋價格和麪積的一組數據,然後推測此地區面積爲100平的房子個價格應該是多少?這就屬於迴歸型監督式學習算法。然後另外一個根據腫塊的大小,預測腫瘤是良性還是惡性,0表示惡性,1表示良性,這種問題就屬於分類型監督式學習算法。分類(classification),對於一個classifier來說,就是告訴它”這個數據屬於XX類“,然後classifier會在提供的訓練集中"學習",然後具有對某個未知數據分類的能力,這種提供提供訓練數據的過程稱爲監督式學習。監督式學習是已有正確答案。

第二:學習理論(learning theory)

第三:無監督學習(unsupervised learning)。聚類(clustering),就是把相似的東西集中到一起,聚類的時候,我們不關心某一類是什麼,我們的目標是將相似的類聚在一起,因此一個聚類算法只需要知道如何計算相似度就可以開始了,並不提供訓練數據,我們稱這種爲無監督學習。無監督式學習適合不知道正確答案的情況下,發現數據集的結構性。例如錄音機錄製了兩個人一起說話的聲音,無監督學習可以將兩個聲音分別提取出來。無監督學習還可以用於文本處理。

第四:強化學習(reinforcement learning):被用在不必進行一次決策的情形之中,強化學習通常是在一段時間之內作出一系列的決策。在強化學習中有一個回報函數的概念。然後需要定義好的行爲和壞的行爲,肯定好的行爲,程序會不斷學習實現好的行爲,以此獲得好的回報。

就像你說蹲下,旺財立即蹲下的時候你會說,”good dog“,否則,”bad dog“。旺財想聽到誇獎,所以它會學習在你說出蹲下的時候立馬蹲下。同樣的對於採用了強化學習的直升機來說,當其摔下時,觸發的壞的行爲,它就會學習下次不再摔下,以此獲得好的回報。

強化學習經常用在機器人領域。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章