什麼是AI
AI is the field that studies the synthesis and analysis of computational agents that act intelligently.
AI are systems that think like humans ,act like hummans , think rationally, act rationally.
限制領域AI(Narrow AI):針對某一領域.
通用AI(General AI):讓AI做任何事情,現階段暫時無法達到這樣的水平.
所以一定要認清技術的邊界以及定義好問題的範圍.
https://mp.weixin.qq.com/s/WOVVnZYTHCVAVHU6hNQcAQ
AI和BI的區別:簡單的來說,BI是一種分析工具,通過一些方式吧數據更直觀的展示給用戶,輔助人去決策.另一方面,AI是通過數據幫助人做決策.所以從這個角度,可以把AI看作是輔助的決策工具,而AI則可以直接幫我們做決策.
什麼是機器學習?
通俗來講,機器學習是解決人工智能問題的最核心的技術.
官方定義: Field of study that gives computers the ablility to learn without being explicitly programmed.
機器學習的核心是,從數據中自動學出規律,而不是一個人拍腦袋定出來的,可以理解爲歸納總結.
什麼是深度學習
深度學習是機器學習的一個分支.
官方定義:Deep Learning is a subfield of machine learning concerned with algeorithms insbired by the structure and function of zhe brain called artificial neural nteworks.
深度學習是一個框架或者認爲是一類方法論.深度可以理解爲將很多簡單的莫i行疊加在一起,比如我們把一個神經網絡疊加成多層結構的時候,得到的是深度神經網絡.
監督學習和無監督學習
機器學習分爲監督學習和無監督學習,兩者的主要區別在於數據有無標籤.
監督學習:D=(X,y),學習X→y的關係,X爲樣本數據.
無監督學習:D=(X),尋找X中的特徵或規律.以聚類爲主
類型 | 算法 |
---|---|
監督學習 | 線性迴歸\邏輯迴歸\樸素貝葉斯\決策樹\隨機森林\svm\神經網絡\ |
無監督學習 | PCA\K-means\GMM\LDA |
迴歸和分類
迴歸問題:輸出的是連續性數值,比如溫度,身高,氣溫等.
分類問題:輸出的是定性輸出,比如陰或者晴,好或者壞.
數據的特徵\樣本\標籤
標籤指預測值
特徵是數據中屬性
樣本指數據
訓練數據和測試數據
訓練數據用來訓練模型
測試數據用來評估模型
機器學習建模流程
Data source →數據預處理→特徵工程→建模→驗證.
Data source指數據,機器學習的基礎
數據預處理:是對數據是對數據降噪.
特徵工程:從樣本中提取出有價值的信號.
建模:調參,改造
建模第一步是理解數據本身,切忌不要急於套用模型,因爲不理解數據的情況下做出來的模型是由着很大的不確定性.
對於數據理解來說,最重要的一項技術叫做數據可視化(data visualization),如僅有一個特徵的情況下,可以在二維空間中展示特徵與預測值之間的關係.假如數據特徵有2個以上,如何進行可視化呢?一,可以降維度,降到二維或三維空間;二,針對於每一個特徵做可視化,以及觀察特徵之間的關係