(一)What_is_Machine_Learning

機器學習

定義

機器學習(統計機器學習)是什麼?字面意思就是讓機器(計算機程序)學習,通過這一過程,可以使自身更加智能化(特別是對未知數據進行預測)。Herbert A. Simon 曾對 “學習” 給出以下定義:“如果一個系統能夠通過執行某個過程改進它的性能,這就是學習。” 按照這一觀點,機器學習就是計算機程序通過運用數據及統計方法來提高系統性能的過程。

分類

In general, any machine learning problem can be assigned to one of two broad classifications: supervised learning or unsupervised learning .

監督學習(supervised learning)

從一個給定的訓練數據集(training data),假設數據是獨立同分布產生的;並且假設要學習的模型屬於某個函數的集合,稱爲假設空間;應用某個評價準則,從假設空間中選取一個最優的模型,使它對已知訓練數據及未知數據在給定的評價準則下有最優的預測;最優的模型選取由算法實現。李航的《統計學習方法》

In supervised learning, we are given a data set and already know what our correct output should look like, having the idea that there is a relationship between the input and the output.

Supervised learning problems are categorized into “regression” and “classification” problems.

在迴歸問題中,我們試圖在連續輸出中預測結果,這意味着我們正在嘗試將輸入變量映射到某個連續函數。 例如:預測年齡、預測房價、預測玩具的價格…

在分類問題中,我們試圖在離散輸出中預測結果。 換句話說,我們試圖將輸入變量映射到離散類別。例如:銀行根據你的年齡,是否結婚、是否有房子等信息來決定是否給你貸款。根據電影中的打鬥鏡頭數、接吻鏡頭數來判別未分類的電影類型(愛情片 or 動作片),手寫數字識別 …

非監督學習(unsupervised learning)

無監督學習使我們能夠在很少或根本不知道我們的結果應該是什麼樣的情況下處理問題。 我們可以從數據中導出結構,我們不一定知道變量的影響。我們可以通過基於數據中變量之間的關係聚類數據來推導出這種結構。在無監督學習的情況下,沒有基於預測結果的反饋。例如:收集1000篇關於美國經濟的論文集,並找到一種方法將這些論文自動分組爲少數幾個相似或相關的不同變量,如詞頻,句子長度,頁數等。

https://github.com/wuchg/Machine_Learning

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章