這裏是集成學習乾貨系列第二談,本篇文章我們來淺談隨機森林,它是一種多決策樹的bagging。
其他乾貨:
集成學習(ensemble learning)乾貨系列(1)——集成學習概述
Bagging
Bootstrap aggregating 簡稱Bagging,其中bootstrap是指基學習器的訓練樣本是對原始訓練數據的自助採樣(bootstrap sampling) 得到,aggregating 是指集成學習器的預測結果爲多個訓練好的基學習器的預測結果的總和。
給定公NNN個樣本的數據集