一篇文章快速學會決策樹(ID3,C4.5, CART等)

什麼是決策樹?

對於線性不可分的數據,我們就要採用非線性決策的方法,決策樹就是非線性決策分類器的一種(我們只討論用於分類的決策樹)。
在這裏插入圖片描述
決策樹,英文: Decision Tree, 是一種基本的分類與迴歸方法。決策樹模型呈樹形結構,它可以認爲是一個if-then的規則集合,也可以認爲是定義在特徵空間與類空間上的條件概率分佈。決策樹模型的主要特點就是具有可讀性、分類速度快,通常包括三個步驟特徵選擇、決策樹的生成和決策樹的修剪。

決策樹模型

分類決策樹模型是一種描述對實例進行分類的樹形結構。決策樹由節點node和有向邊directed edge 組成。結點有兩種類型:內部結點internal node和葉子結點leaf node。內部結點表示一個特徵或屬性,而葉結點表示一個類。

我們以一個簡單的決策樹爲例:在這裏插入圖片描述
過程如下:從根節點開始,對實例的某一個特徵進行測試(比如上圖從根節點先

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章