1. Aggregation
首先舉一個買房的例子,假如你有10個朋友給出了買房的意見,你如何參考這10個人的意見做出決定呢?
- 第一種辦法是讓大家投票,每人一票,最後選擇得票數最多的那個選項
- 第二種辦法也是投票,與第一種不同的是每個人手裏的票數不一樣,懂行的人可能會分配更多的票數
- 第三種辦法是根據具體條件進行判斷:這10個人中,有的人可能注重房源的地理位置,有的人可能更注重交通狀況。根據不同的條件參考不同人的意見。
Aggregation的目的就是要融合多個hypothesis,從而達到更好的預測效果。
以上三種投票方式分別對應了機器學習中的三種Aggregation類型,即Uniform Blending、Linear Blending和Any Blending
2. Uniform Blending
分類與迴歸模型的Uniform Blending
對於多分類模型,Uniform Blending可將得票數最多的那一類作爲最終的分類結果,其中
對於迴歸模型,Uniform Blending將每一個
Uniform Blending的可行性:
3. Linear Blending和Any Blending
Linear Blending
對於迴歸問題,Linear Blending 就是將
在對
Any Blending
注意overfitting問題
4. Bootstrap (Bagging)
首先回顧一下如何獲得不同的
第一種是從不同的模型得到不同的
bootstrapping 的思想就是利用現有的訓練數據模擬出不同的數據集,從而訓練出不同的