機器學習前菜

人工智能三次浪潮

隨着大數據的興起,機器學習、人工智能也隨之火爆。其實,人工智能這個概念並不新鮮,早在上個世紀五十年代就已經有人提出,到目前爲止已有三次浪潮,分別是:

人工智能第一次浪潮:

  • 1950-1970,符號主義流派:專家系統占主導地位
  • 1950 :圖靈設計國際象棋程序
  • 1956 Artificial Intelligence  提出,人工智能的目的就是讓計算機這臺機器能夠像人一樣思考
  • 1962 :IBM Arthur Samuel  的跳棋程序戰勝人類高手

人工智能第二次浪潮:

  • 1980-2000,統計主義流派,主要用統計模型解決問題
  • Vapnik 1993,SVM模型
  • 1997 :IBM  深藍戰勝象棋選手卡斯帕羅夫 

人工智能第三次浪潮:

  • 2010- 至今,神經網絡、深度學習、大數據流派
  • Hinton 2006,DNN(深度神經網絡)
  • 2016 :Google AlphaGO  戰勝圍棋選手李世石 

機器學習與大數據

在大數據架構中,機器學習處於上層階段,基於大數據做完數據存儲和數據分析之後,進一步挖掘數據存在的模式,得到一個對應於數據的模型,這個模型可以給我們提供一些決策或預測結果。

數據分析與數據挖掘 


各個技術的交叉

人工智能是一個很大的範疇,包括:

  • 機器學習、
  • 神經網絡、
  • 數據挖掘
  • 模式識別

機器學習是一種技術,支持:

  • 人工智能
  • 數據挖掘
  • 模式識別

人工智能 > 機器學習 > 深度學習 > 神經網絡

  • 深度學習是機器學習的一種方法,用來解決圖像、語音等特徵識別的方法
  • 神經網絡屬於機器學習的範疇,是深度學習發展的產物

統計學是數據科學的基礎,

數據庫是在數據挖掘過程中提供數據管理和服務的支持

知識發現:知識圖譜類似

確定的問題,數值計算的問題,不是機器學習,機器學習看是否有預測的過程


機器學習的應用場景

機器學習,專門研究計算機如何能夠模擬或實現人類的學習行爲,以獲取新的知識或技能,從而重新組織這些新的技術或技能提高自身的性能或能力。

1、人臉識別

2、無人駕駛

3、自然語言處理

4、推薦系統

5、計算廣告

6、語音識別

機器學習的基本概念

訓練集,測試集,特徵值,監督學習,非監督學習,半監督學習,分類,迴歸

  • 數據集:城市數據集
  • 行:樣本數據
  • 列:特徵或屬性數據(除去最後一列的標籤列)
  • 屬性空間:屬性張成的空間
  • 特徵向量:每一個樣本中的數據組成的向量
  • 訓練集:用於模型訓練的數據集,X+Y
  • 測試集:用於校驗模型的優劣程度,X+Y
  • 訓練過程:(學習過程)使用訓練數據集+機器學習算法==>模型
  • 模型:將測試集中除去Y部分灌入模型中進行預測Y1
  • 誤差:Y-Y1
  • 測試誤差:模型在測試集上的誤差
  • 訓練誤差:模型在訓練集上的誤差
  • 泛化誤差:對新數據的適應能力
  • 準確率:預測爭取的個數/全部個數個數
  • 錯誤率:預測錯誤的個數/全部樣本個數

分類與迴歸

輸出變量是否是連續值

  •  是——>迴歸
  • 不是——>分類

分類算法

  • 決策樹
  • KNN
  • SVM
  • Perception&NeuralNetwork
  • Bayes
  • LogisticRegression

迴歸算法

  • 簡單線性迴歸
  • 多元線性迴歸
  • lasso迴歸
  • Ridge迴歸
  • ElasticNet

監督學習,無監督學習,半監督學習

1、監督學習(有類別標籤的學習行爲):

  • 將分類和迴歸統稱爲監督學習

無監督學習(沒有類別標籤的數據集學習方式)——方法:聚類、降維

半監督學習(有的數據集有標籤有的數據集沒有標籤)

  • 通過聚類的方法,利用組內數據相似性大,組外差異大的特徵進行分組,再利用組內已經有標籤的數據,通過少數服從多數的原則給無標記的樣本打上標記,然後訓練模型進行預測
  • 根據是否將未標記數據作爲預測數據分爲
    • 純半監督學習
    • 直推學習【將未標記數據作爲預測數據】

強化學習

  • 強化學習:主要用來解決連續決策問題。 比如:無人車、AlphaGo

【目標是變化的、不明確的,甚至可能存在絕對正確的標籤】

目標Agent通過action和環境進行交互的過程,來提高目標本身的一個性能

環境當前的狀態包含 reward(反饋) 和 state(行爲)

目標通過action和環境進行交互,得到狀態的改變,根據這個狀態改變是否對最終結果有正向影響,會給一個reward的獎勵(有正向影響就給獎勵,沒有就不給獎勵)

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章