最近對文章中的懲罰函數不是很理解,今天整理一下。
講到懲罰函數,首先要提到約束問題,所謂的約束問題就是在一定的約束條件下,求得問題的最優解
例如 min f(x) s.t. gi(x)>0,hj(x)=0 i=1,..m,j=1,2,...l。其中s.t.是subject to的縮寫,即服從,滿足的意思。
這類問題的可行解法是梯度下降算法,或者是序列無約束優化方法:即通過求解一系列無約束問題的解來近似約束問題的解。
罰函數法則是序列無約束問題算法的典型代表。
罰函數的基本思想是構造輔助函數,把原來的約束問題轉化爲求極小化輔函數的無約束問題
例如可以定義函數F:Rn->R 爲
F(x )={f(x),xED
+Inf,x!E D
那麼問題就轉化爲了在xERn中,求解F(x)的最小值了。
因爲只是做一個大概的瞭解,具體內容可以參考http://wenku.baidu.com/link?url=EfpEMJYgIo1Y3yIJoJsh8jHfFj2GY4NWV74Xk_csRo3xSQ3yx6_iuXyxa9EG70T-qW5pOlKxlm_D-e04cndIXkklD5mUukYrdroJJPOxPQ3
北郵的一個PPT