今天是機器學習的第一小節學習(吳恩達)。
問題提出:
現在我們有一些真實的數據集,表示房屋的大小,表示房屋出售的價格。
然後我們有一個房子要出售,已知房屋大小是,希望能夠知道能賣多少錢。
我們會建立數據集中的x和y之間的一元線性關係(假設函數) : 。希望找到 ,使假設函數和數據集上的點更好的擬合。
也就是說:
要儘可能的小,這樣才能更好的擬合。
其中: : 被稱爲假設函數。
(預測) 表示:在數據集中找到一個後,利用 得到的值。
(真實) 表示:在數據集中 和 相對應的值。
所以,我們要研究的問題其實是一個最小化問題。
爲了能使 y(預測)-y(真實)儘可能小 , 有
代價函數 = {[(預測) - (真實)]}
就是令代價函數最小。
- m表示 數據集中數據(x,y)的數量。
- i(預測) =
現在,我們的問題就變成了 尋找 ,使代價函數的值最小。(這個代價函數也叫誤差平方函數或者誤差平方代價函數 )。
誤差平方代價函數是我們常使用的一種代價函數。
當我們找到了是代價函數最小的 之後,就找到了
假設函數 ,就可以利用假設函數來預測房價了。