機器學習前菜

原創

2020-05-15 02:04

人工智能三次浪潮

隨着大數據的興起，機器學習、人工智能也隨之火爆。其實，人工智能這個概念並不新鮮，早在上個世紀五十年代就已經有人提出，到目前爲止已有三次浪潮，分別是：

人工智能第一次浪潮：

1950-1970，符號主義流派：專家系統占主導地位
1950 ：圖靈設計國際象棋程序
1956 Artificial Intelligence 提出，人工智能的目的就是讓計算機這臺機器能夠像人一樣思考
1962 ：IBM Arthur Samuel 的跳棋程序戰勝人類高手

人工智能第二次浪潮：

1980-2000，統計主義流派，主要用統計模型解決問題
Vapnik 1993，SVM模型
1997 ：IBM 深藍戰勝象棋選手卡斯帕羅夫

人工智能第三次浪潮：

2010- 至今，神經網絡、深度學習、大數據流派
Hinton 2006，DNN（深度神經網絡）
2016 ：Google AlphaGO 戰勝圍棋選手李世石

機器學習與大數據

在大數據架構中，機器學習處於上層階段，基於大數據做完數據存儲和數據分析之後，進一步挖掘數據存在的模式，得到一個對應於數據的模型，這個模型可以給我們提供一些決策或預測結果。

數據分析與數據挖掘

各個技術的交叉

人工智能是一個很大的範疇，包括：

機器學習、
神經網絡、
數據挖掘
模式識別

機器學習是一種技術，支持：

人工智能
數據挖掘
模式識別

人工智能 > 機器學習 > 深度學習 > 神經網絡

深度學習是機器學習的一種方法，用來解決圖像、語音等特徵識別的方法
神經網絡屬於機器學習的範疇，是深度學習發展的產物

統計學是數據科學的基礎，

數據庫是在數據挖掘過程中提供數據管理和服務的支持

知識發現：知識圖譜類似

確定的問題，數值計算的問題，不是機器學習，機器學習看是否有預測的過程。

機器學習的應用場景

機器學習，專門研究計算機如何能夠模擬或實現人類的學習行爲，以獲取新的知識或技能，從而重新組織這些新的技術或技能提高自身的性能或能力。

1、人臉識別

2、無人駕駛

3、自然語言處理

4、推薦系統

5、計算廣告

6、語音識別

機器學習的基本概念

訓練集，測試集，特徵值，監督學習，非監督學習，半監督學習，分類，迴歸

數據集：城市數據集
行：樣本數據
列：特徵或屬性數據(除去最後一列的標籤列)
屬性空間：屬性張成的空間
特徵向量：每一個樣本中的數據組成的向量
訓練集：用於模型訓練的數據集，X+Y
測試集：用於校驗模型的優劣程度，X+Y
訓練過程：(學習過程)使用訓練數據集+機器學習算法==>模型
模型：將測試集中除去Y部分灌入模型中進行預測Y1
誤差：Y-Y1
測試誤差：模型在測試集上的誤差
訓練誤差：模型在訓練集上的誤差
泛化誤差：對新數據的適應能力
準確率：預測爭取的個數/全部個數個數
錯誤率：預測錯誤的個數/全部樣本個數

分類與迴歸

輸出變量是否是連續值

是——>迴歸
不是——>分類

分類算法

決策樹
KNN
SVM
Perception&NeuralNetwork
Bayes
LogisticRegression

迴歸算法

簡單線性迴歸
多元線性迴歸
lasso迴歸
Ridge迴歸
ElasticNet

監督學習，無監督學習，半監督學習

1、監督學習(有類別標籤的學習行爲)：

將分類和迴歸統稱爲監督學習

無監督學習(沒有類別標籤的數據集學習方式)——方法：聚類、降維

半監督學習(有的數據集有標籤有的數據集沒有標籤)

通過聚類的方法，利用組內數據相似性大，組外差異大的特徵進行分組，再利用組內已經有標籤的數據，通過少數服從多數的原則給無標記的樣本打上標記，然後訓練模型進行預測

根據是否將未標記數據作爲預測數據分爲
- 純半監督學習
- 直推學習【將未標記數據作爲預測數據】

強化學習

強化學習：主要用來解決連續決策問題。比如：無人車、AlphaGo

【目標是變化的、不明確的，甚至可能存在絕對正確的標籤】

目標Agent通過action和環境進行交互的過程，來提高目標本身的一個性能

環境當前的狀態包含 reward（反饋）和 state（行爲）

目標通過action和環境進行交互，得到狀態的改變，根據這個狀態改變是否對最終結果有正向影響，會給一個reward的獎勵（有正向影響就給獎勵，沒有就不給獎勵）

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

機器學習前菜

人工智能三次浪潮

機器學習與大數據

各個技術的交叉

機器學習的應用場景

機器學習的基本概念

分類與迴歸

監督學習，無監督學習，半監督學習

強化學習

python gdal 安裝使用（Windows， python 3.6.8）

從Git安裝、配置遠程倉庫到免輸入密碼推送一次搞掂

機器學習前菜

使用Sublime對比兩個文件，並解決對比過程中的中文亂碼

入門人工智能之初見Python

解決DNS服務器未響應網絡異常

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結