1.1 引言
人類可以對很多未知的事物作出有效的預判,是因爲我們已經積累了許多經驗,而通過對經驗的利用,就能對心的情況作出有效的決策。
同樣的預判能力,計算機能夠完成嗎?
機器學習正是這樣一門學科,它致力於研究如何通過計算的手段,利用經驗來改善系統自身的性能。機器學習所研究的主要內容就是“學習算法”,“學習算法”就是指計算機通過從數據中產生“模型”的過程。有了學習算法,我們爲它提供數據,算法基於數據產生模型。產生的模型就可以完成類似於人類的預判能力。
1.2 基本術語
一般地,令表示m個實例的數據集,每個示例由d個屬性描述,則每個示例
是d維樣本空間X中的一個向量,X,其中是在第j個屬性上的取值,d稱爲樣本的“維度”(dimensionality).