3.1 基本形式
給定由d個屬性描述的示例,其中是x的第i個屬性上的取值,線性模型試圖學得一個通過屬性的線性組合來進行預測的函數, 即
一般用向量形式寫成
其中.和b學得之後,模型就可以確定。
3.2 線性迴歸
給定數據集,其中。”線性迴歸“試圖學得一個線性模型以儘可能準確地預測實值輸出標記。我們先考慮最簡單的情形:輸入屬性的數目只有一個。爲便於討論,此時我們忽略關於屬性的下標,即,其中.對離散屬性,若屬性間存在”序“關係,可通過連續化將其轉化爲連續值,例如二值屬性”身高“的取值”高“”矮“可轉化爲{1.0, 0.0},三值屬性”高度“的取值”高“”中“”低“可轉化爲{1.0, 0.5, 0.0};若屬性間不存在序關係,假定有k個屬性值,則通過轉化爲k維向量。
爲確定和b,由於均方誤差時迴歸任務中最常用的性能度量,因此我們可讓均方誤差最小化,即
均方誤差有非常好的集合意義,它對應了常用的歐幾里得距離或簡稱”歐式距離“。基於均方誤差最小化來進行模型求解的方法稱爲”最小二乘法“。在線性迴歸中,最小二乘法就是試圖找到一條直線,使所有樣本到直線上的歐式距離之和最小。
求解和b使最小化的過程,稱爲線性迴歸模型的最小二乘”參數估計“。我們可將分別對和b求導,得到
然後令上面兩式爲0可得到和b最優解的閉式解,即:
其中爲x的均值。
更一般的情形是如本節開頭的數據集D,樣本有d個屬性描述。此時我們試圖學得,使得,這就稱爲“多元線性迴歸”。類似的,可利用最小二乘法對和b進行估計。爲便於討論,我們把和b吸收入向量形式,相應的,把數據集D表示爲一個大小的矩陣X,其中每行對應一個示例,該行前d個元素對應於示例的d個屬性值對應於示例的d個屬性值,最後一個元素橫置爲1,即:
再把標記也寫成標量的形式,有。
令,對求導得到,令其爲0可得最優解的閉式解,此時我們做一個簡單的討論。當爲滿秩矩陣或正定矩陣時,令前面的式子爲0可得。令,則最終學得的多元線性迴歸模型爲。