臺大機器學習基石 Lecture 3 - Types of Learning

原創

2020-06-25 22:48

本章主要講了不同的學習方法，主要有Output Space, Data Label, Protocol, Input Space四個方面。

在上圖[ ]以及後文中黃色標記的內容爲本課程中主要講解的內容。

Learning with Different Output Space $\large y$

Learning with Different Data Label $\large y_n$

增強學習中,我們給模型或系統一些輸入,但是給不了我們希望的真實的輸出y,根據模型的輸出反饋,如果反饋結果良好,更接近真實輸出,就給其正向激勵,如果反饋結果不好,偏離真實輸出,就給其反向激勵。不斷通過“反饋修”這種形式,一步一步讓模型學習的更好,這就是增強學習的核心所在。

其實就是不同的學習方法，主要分爲以下三類：

batch: 即是一次性拿到所有的數據集。
online: 在線學習模型，通過不斷更新數據，可以在線更新模型。一些batch learning的模型也可以修改爲online learning的模型，比如PLA模型的修正就可以在線進行。
active: 讓模型具有主動問問題的能力，也就是在獲取label比較困難的時候可以主動提出需求以節約成本。

輸入數據的不同類型？

concrete: each dimension of $\large x\subseteq \mathbb{R}^{d}$ represents ‘sophisticated physical meaning’，具有具體意義的特色輸入對機器學習最簡單。
raw: often need human or machines to convert to concrete ones，原始數據需要轉換成對應的具體特徵。
abstract: 特徵完全抽象，沒有實際的物理含義。所以對於機器學習來說是比較困難的，需要對特徵進行更多的轉換和提取。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.