用是否買房爲例來說明決策樹算法的使用-AI機器學習

我們以是否買房爲例子給大家介紹一下決策樹算法的使用,數據集如下(僅做演示,不代表真實情況)

地段

近地鐵

面積

單價(萬)

是否購買

三環

60

8

三環

80

8

三環

60

7

三環

80

7

五環

60

7

五環

80

7

五環

60

6

五環

80

6

六環

60

6

六環

80

5.5

六環

60

5

六環

80

5

從上表中我們可以看到,確定可以購買的數量有7個,不購買的數量有5個,共數是12個。按信息熵的計算公式我們可以得出此數據集的信息熵爲:

image

按地段(用A1表示)劃分,三環(D1),五環(D2),六環(D3),來計算信息增益

image

按是否近地鐵(用A2表示)劃分,是(D1),否(D2), 來計算信息增益

image

按面積(用A3表示)劃分,60平(D1),80平(D2), 來計算信息增益

image

按單價劃分(用A4表示),5w(D1), 5.5w(D2), 6w(D3), 7w(D4), 8w(D5) , 來計算信息增益

image

通過以上結果我們可以知道,對於信息熵的降低量(就是說人們決定是否買房的決定因素的權重)由高到低分別爲:單價、面積、地段、是否近地鐵

以上算法就是決策樹算法中ID3算法所採用的邏輯。

注:數量僅作爲演示用的測試數據,不代表真實決策依據。


關注微信公衆號“挨踢學霸”,獲取更多人工智能技術文章

image

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章