關於ablation study消融實驗

在讀論文的時候讀到一個研究方法叫ablation study,即消融實驗,想要弄懂這個概念。

作者:SleepyBag
鏈接:https://www.zhihu.com/question/60170398/answer/673961942
來源:知乎
著作權歸作者所有。商業轉載請聯繫作者獲得授權,非商業轉載請註明出處。
比如說你爲了提升baseline的性能,給它加了兩個模塊A,B,加完之後效果果然提高了很多。於是你急急忙忙開始寫論文,寫到你的貢獻,你給了兩條:1.模塊A,2.模塊B。但是這樣寫有個問題:儘管AB同時加上去對模型有提升效果,但是你並沒有證明A、B兩個模塊分別都是有意義的。所以爲了驗證A、B兩個模塊是不是真的都有用,你需要做ablation study。方法也很簡單:
在baseline的基礎上加上模塊A,看效果。
在baseline的基礎上加上模塊B,看效果。
在baseline的基礎上同時加上模塊AB,看效果。
然後結果可能是,實驗1和實驗2的結果都不如實驗3,那麼說明AB都是有用的;然而也有可能你會發現實驗1的結果和實驗3一樣,甚至更好。這就說明你的想法是有問題的,模塊B其實並沒有起到作用,提升只來自於模塊A。

簡單來講就是控制變量,當模型非常複雜的時候,想要驗證其中的一個結構是否work,就只將去掉該結構的網絡與加上該結構的網絡所得到的結果進行對比,就是所謂的ablation study。
P.S.根據奧卡姆剃刀原則,簡單和複雜的方法能達到一樣的效果,那麼簡單的方法更可靠。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章