曼孚科技:AI機器學習領域常用的15個術語

機器學習是人工智能(AI)的核心,是使計算機具有智能的根本途徑。

本文整理了一下機器學習領域常用的15個術語,希望可以幫助大家更好的理解這門涉及概率論、統計學、逼近論、凸分析、算法複雜度理論等多個領域的龐雜學科。

1. AdaBoost(Adaptive Boosting)

AdaBoost是Adaptive Boosting的縮寫。

AdaBoost是一種迭代算法,其核心思想是針對同一個訓練集訓練不同的分類器(弱分類器),然後把這些弱分類器集合起來,構成一個更強的最終分類器(強分類器)。

2. 隨機森林(Random Forest)

隨機森林屬於集成學習中Bagging(Bootstrap AGgregation的簡稱)的方法。

在機器學習中,隨機森林是一個包含多個決策樹的分類器,並且其輸出的類別是由個別樹輸出的類別的衆數而定。

構造隨機森林的4個步驟

3. 無監督學習(Unsupervised Learning)

無監督學習是機器學習的一個分支,它從未經標記或分類的測試數據中學習。它本質上是一個統計手段,在沒有標籤的數據裏可以發現潛在的一些結構。

無監督學習不是響應反饋,而是根據每個新數據中是否存在這種共性來識別數據中的共性並做出反應。

4. 監督學習(Supervised Learning)

監督學習是指利用一組已知類別的樣本調整分類器的參數,使其達到所要求性能的過程。

監督學習是從標記的訓練數據來推斷一個功能的機器學習任務。在監督學習中,每個實例都是由一個輸入對象(通常爲矢量)和一個期望的輸出值(也稱爲監督信號)組成。監督學習算法是分析該訓練數據,併產生一個推斷的功能,其可以用於映射出新的實例。

5. 深度學習(Deep Learning)

深度學習是機器學習中一種基於對數據進行表徵學習的方法。

其屬於機器學習的範疇,可以說是在傳統神經網絡基礎上的升級,約等於神經網絡。它的好處是用非監督式或半監督式的特徵學習和分層特徵提取高效算法來替代手工獲取特徵。

深度學習是機器學習研究中的一個新的領域,其動機在於建立、模擬人腦進行分析學習的神經網絡,它模仿人腦的機制來解釋數據,例如圖像,聲音和文本。

6. 強化學習(Reinforcement Learning)

強化學習(Reinforcement Learning),又稱再勵學習、評價學習,是一種重要的機器學習方法,在智能控制機器人及分析預測等領域有許多應用。

在強化學習中,機器達到預期效果時會得到正強化,沒有達到預期結果時會得到負強化。

7. K均值聚類(K-means Clustering)

K均值聚類算法是先隨機選取K個對象作爲初始的聚類中心,然後計算每個對象與各個種子聚類中心之間的距離,把每個對象分配給距離它最近的聚類中心。

聚類中心以及分配給它們的對象就代表一個聚類。一旦全部對象都被分配了,每個聚類的聚類中心會根據聚類中現有的對象被重新計算。

這個過程將不斷重複直到滿足某個終止條件。終止條件可以是沒有(或最小數目)對象被重新分配給不同的聚類,沒有(或最小數目)聚類中心再發生變化,誤差平方和局部最小。

8. 聚類分析(Cluster Analysis)

聚類分析指將物理或抽象對象的集合分組爲由類似的對象組成的多個類的分析過程。

聚類分析的目標就是在相似的基礎上收集數據來分類。聚類源於很多領域,包括數學、計算機科學、統計學、生物學和經濟學等。

9. 集成學習(Ensemble Learning)

集成學習是使用一系列學習器進行學習,並使用某種規則把各個學習結果進行整合從而獲得比單個學習器更好的學習效果的一種機器學習方法。

10. 支持向量機(Support Vector Machine)

在機器學習中,支持向量機(SVM,還支持矢量網絡)是與相關的學習算法有關的監督學習模型,可以分析數據,識別模式,用於分類和迴歸分析。

支持向量機是目前最流行和最受關注的機器學習算法之一。

11. 決策樹(Decision Tree)

決策樹算法是一種逼近離散函數值的方法。它是統計、數據挖掘和機器學習中使用的預測建模方法之一。

12. 邏輯迴歸(Logistic Regression)

邏輯迴歸是一種廣義的線性迴歸分析模型,常用於數據挖掘、疾病自動診斷、經濟預測等領域。邏輯迴歸主要解決分類問題,用來表示某件事情發生的可能性。

13. 樸素貝葉斯(Naive Bayes Classifier)

樸素貝葉斯是一種簡單但令人驚訝的強大的預測建模算法。

樸素貝葉斯被稱爲樸素,因爲它假設每個輸入變量是獨立的。這是一個強有力的假設,對於實際數據是不現實的,然而,該技術對於大範圍的複雜問題非常有效。

14. 線性迴歸(Linear Regression)

線性迴歸本來是統計學裏的概念,現在經常被用在機器學習中。

如果兩個或者多個變量之間存在“線性關係”,那麼我們就可以通過歷史數據,摸清變量之間的“套路”,建立一個有效的模型,來預測未來的變量結果。

15. 機器學習(Machine Learning)

機器學習專門研究計算機怎樣模擬或實現人類的學習行爲,以獲取新的知識或技能,重新組織已有的知識結構使之不斷改善自身的性能。

它是人工智能的核心,是使計算機具有智能的根本途徑,其應用遍及人工智能的各個領域,它主要使用歸納、綜合而不是演繹。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章