初識AI

什麼是AI

AI is the  field that studies the synthesis and analysis of computational agents that act intelligently.

AI are systems that   think like humans ,act like hummans , think rationally, act rationally.

限制領域AI(Narrow AI):針對某一領域.

通用AI(General AI):讓AI做任何事情,現階段暫時無法達到這樣的水平.

所以一定要認清技術的邊界以及定義好問題的範圍.

https://mp.weixin.qq.com/s/WOVVnZYTHCVAVHU6hNQcAQ

AI和BI的區別:簡單的來說,BI是一種分析工具,通過一些方式吧數據更直觀的展示給用戶,輔助人去決策.另一方面,AI是通過數據幫助人做決策.所以從這個角度,可以把AI看作是輔助的決策工具,而AI則可以直接幫我們做決策.

什麼是機器學習?

通俗來講,機器學習是解決人工智能問題的最核心的技術.

官方定義: Field of study that gives computers the ablility to learn without being explicitly programmed.

機器學習的核心是,從數據中自動學出規律,而不是一個人拍腦袋定出來的,可以理解爲歸納總結.

什麼是深度學習

深度學習是機器學習的一個分支.

官方定義:Deep  Learning is a subfield of machine learning concerned with algeorithms  insbired by the structure and function of zhe brain called artificial neural nteworks.

深度學習是一個框架或者認爲是一類方法論.深度可以理解爲將很多簡單的莫i行疊加在一起,比如我們把一個神經網絡疊加成多層結構的時候,得到的是深度神經網絡.

監督學習和無監督學習

機器學習分爲監督學習和無監督學習,兩者的主要區別在於數據有無標籤.

監督學習:D=(X,y),學習X→y的關係,X爲樣本數據.

無監督學習:D=(X),尋找X中的特徵或規律.以聚類爲主

類型 算法
監督學習 線性迴歸\邏輯迴歸\樸素貝葉斯\決策樹\隨機森林\svm\神經網絡\
無監督學習 PCA\K-means\GMM\LDA

迴歸和分類

迴歸問題:輸出的是連續性數值,比如溫度,身高,氣溫等.

分類問題:輸出的是定性輸出,比如陰或者晴,好或者壞.

數據的特徵\樣本\標籤

標籤指預測值

特徵是數據中屬性

樣本指數據

訓練數據和測試數據

訓練數據用來訓練模型

測試數據用來評估模型

機器學習建模流程

Data source →數據預處理→特徵工程→建模→驗證.

Data source指數據,機器學習的基礎

數據預處理:是對數據是對數據降噪.

特徵工程:從樣本中提取出有價值的信號.

建模:調參,改造

 

建模第一步是理解數據本身,切忌不要急於套用模型,因爲不理解數據的情況下做出來的模型是由着很大的不確定性.

對於數據理解來說,最重要的一項技術叫做數據可視化(data visualization),如僅有一個特徵的情況下,可以在二維空間中展示特徵與預測值之間的關係.假如數據特徵有2個以上,如何進行可視化呢?一,可以降維度,降到二維或三維空間;二,針對於每一個特徵做可視化,以及觀察特徵之間的關係

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章