機器學習第一講

原創

lz199057

2020-06-26 22:12

機器學習課程包括四個部分：

第一：監督式學習(supervised learning)，有兩種類型：迴歸和分類。採集了某地區的房屋價格和麪積的一組數據，然後推測此地區面積爲100平的房子個價格應該是多少？這就屬於迴歸型監督式學習算法。然後另外一個根據腫塊的大小，預測腫瘤是良性還是惡性，0表示惡性，1表示良性，這種問題就屬於分類型監督式學習算法。分類(classification)，對於一個classifier來說，就是告訴它”這個數據屬於XX類“，然後classifier會在提供的訓練集中"學習"，然後具有對某個未知數據分類的能力，這種提供提供訓練數據的過程稱爲監督式學習。監督式學習是已有正確答案。

第二：學習理論(learning theory)

第三：無監督學習(unsupervised learning)。聚類(clustering),就是把相似的東西集中到一起，聚類的時候，我們不關心某一類是什麼，我們的目標是將相似的類聚在一起，因此一個聚類算法只需要知道如何計算相似度就可以開始了，並不提供訓練數據，我們稱這種爲無監督學習。無監督式學習適合不知道正確答案的情況下，發現數據集的結構性。例如錄音機錄製了兩個人一起說話的聲音，無監督學習可以將兩個聲音分別提取出來。無監督學習還可以用於文本處理。

第四：強化學習(reinforcement learning):被用在不必進行一次決策的情形之中，強化學習通常是在一段時間之內作出一系列的決策。在強化學習中有一個回報函數的概念。然後需要定義好的行爲和壞的行爲，肯定好的行爲，程序會不斷學習實現好的行爲，以此獲得好的回報。

就像你說蹲下，旺財立即蹲下的時候你會說，”good dog“，否則，”bad dog“。旺財想聽到誇獎，所以它會學習在你說出蹲下的時候立馬蹲下。同樣的對於採用了強化學習的直升機來說，當其摔下時，觸發的壞的行爲，它就會學習下次不再摔下，以此獲得好的回報。

強化學習經常用在機器人領域。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

機器學習第一講

單選框和複選框組

多級分佈加載樹節點

機器學習第一講

Pytho中兩種方式導入模塊的差別

Grid分組彙總

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結