Lesson 1 學習問題

    這是加州理工學院的《機器學習與數據挖掘》的公開課的第一講:學習問題。整節課從下面五個方面進行,(1)機器學習的例子,(2)學習的構成,(3)一個簡單的模型,

(4)學習的類型,(5)一道思考題。


1、機器學習的例子:預測觀衆會如何評價一部電影


                                                                     

   機器學習就是從電影到評價結果rating出發,試圖找出與評價相一致的因素。隨機抽取觀衆,電影和電影評價,然後通過上千萬個數據統計得到每個觀衆的喜好形成一個向量,每個電影的特點形成一個向量,不斷使得兩個向量的內積與評價結果一致,然後找出評價模式與觀衆的評論一致。最後任意給出一個觀衆和一部電影,通過該模式就能預測出這位觀衆會如何評價這部電影。


2、學習的構成


學習的組成一般有:輸入、輸出、目標函數、訓練集(輸入輸出構成的)、假設函數


目標函數是未知的,是我們要求解的。通過客觀分析得到一個假設集,然後訓練集通過學習算法不斷學習,最終得到一個無限接近目標函數的假設函數。假設函數即是最終解。



3.學習模型


H是整個假設集,g是最終解,h是H中任意一個元素。

(1)一個簡單的假設集——感知器


x1,x2,....,xd是固定的,通過改變wi和w0的值找到滿意的解。然後設置零點x0,使得整個等式符號爲正,這樣整個式子變爲W向量和X向量的內積。

(2)一個簡單的學習算法—— PLA


 利用給定的訓練集通過上面的感知器假說集進行運算,然後找出分類錯誤的點,並調節權制w。如圖,當h(x)=+1即y=+1分類錯誤時,權值向量w與輸入向量的夾角小於90度,所以改變權值使得w=w+yx,會使得h(x)=-1。反之同理可得y=-1的情況。


對於因爲一個分類錯誤的點調節權值而導致所有點分類錯誤的情況,可選擇一個分類錯誤的點進行PLA的不斷迭代。


4.學習類型


機器學習的本質是利用很多的觀察結果即數據去挖掘一個潛在的過程。機器學習分爲三類:(1)監督學習,(2)非監督學習,(3)增強學習

假設你有一個售貨機,需要自動識別硬幣值。

(1)你可以實際測量每種硬幣的尺寸,得出對值(尺寸,幣值),然後學習就可以自動分類到確定幣值,這就是監督學習。監督學習會給定訓練集包含輸入和正確的輸出(input, correct output) 。

(2)你也可以不測硬幣的尺寸,直接進心識別,然後會識別出不同尺寸堆的硬幣,但無法得知每種尺寸的硬幣的幣值,這就是非監督學習。非監督學習給定訓練集只包含輸入,不包含輸出(input,?)

(3)增強學習是指給定輸入和一些輸出,並對輸出進行評價,從而矯正答案。(input,some output,grade for output)

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章