深入理解帕累託與多目標優化相關理論


以下Pareto理論部分參考自

https://blog.csdn.net/u010180815/article/details/78994486?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-4.nonecase&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-4.nonecase

維弗雷多·帕雷託 (Villefredo Pareto) 在1987年提出:社會財富的80%是掌握在20%的人手中,而餘下的80%的人只佔有20%的財富。漸漸地,這種“關鍵的少數(vital few)和次要的多數(trivial many)”的理論,被廣爲應用在社會學和經濟學中,並被成之爲Pareto原則(Pareto Principle)。Pareto Principle也常被稱爲80/20原則,或稱帕累托法則、帕累託定律、最省力法則或不平衡原則、猶太法則。而帕累托法則認爲:原因和結果、投入和產出、努力和報酬之間本來存在着無法解釋的不平衡。


Pareto Optimal(帕累托最優理論)

Pareto Optimal在維基的解釋是:“不可能再改善某些人的境況,而不使任何其他人受損”。帕雷託最優的定義:帕雷託最優是資源分配的一種狀態,在不使任何人境況變壞的情況下,不可能再使某些人的處境變好。帕累托最優(Pareto Optimality),也稱爲帕累託效率、帕累託改善,是博弈論中的重要概念,並且在經濟學, 工程學和社會科學中有着廣泛的應用。

Pareto解

Pareto解又稱非支配解或不受支配解(nondominated solutions):在有多個目標時,由於存在目標之間的衝突和無法比較的現象,一個解在某個目標上是最好的,在其他的目標上可能是最差的。這些在改進任何目標函數的同時,必然會削弱至少一個其他目標函數的解稱爲非支配解或Pareto解。一組目標函數最優解的集合稱爲Pareto最優集。最優集在空間上形成的曲面稱爲Pareto前沿面(Pareto optimal front)。Pareto 在1986 年提出多目標的解不受支配解(Non-dominated set)的概念,其定義爲:假設任何二解S1及S2對所有目標而言,S1均優於S2,則我們稱S1 支配S2,若S1沒有被其他解所支配,則S1 稱爲非支配解(不受支配解),也稱Pareto解。

多目標優化的帕累託解

考慮下圖,我們以國家經濟發展的又快又好爲多目標優化,那麼他的帕累託前沿面如圖所示,面上的每個點都對應一個<速度,質量>的策略,而前沿面上的每個策略都在其中一個目標上做到了極致,也就是說在相同速度的情況下,前沿面上的點總是質量最好的。想提升速度,那麼必須相應的降低質量。
在這裏插入圖片描述

但是多目標優化問題往往沒有這麼好的前沿面,考慮同時最小化兩個目標,我們得到的前沿面往往是比較奇怪的,類似於下圖:
在這裏插入圖片描述
同時使這兩個目標最小化的點稱之爲oracle solution–神才能到達的點,這樣的多目標優化問題時很難的,我們一般通過等價變化將他變成單目標優化的形式。下面將通過嶺迴歸來探討這個轉變的過程。

Pareto理論使用實例-嶺迴歸

嶺迴歸(Ridge Regression)

嶺迴歸在本質上時一個雙目標優化問題,我們希望誤差的二範數的平方儘可能的小,也希望xx的能量儘可能的小,因此可以寫爲如下的形式
minbAx22\min ||b-Ax||^2_2
minx22\min ||x||_2^2

他的曲線我們可以畫成如下的形式:
在這裏插入圖片描述
他的帕累託前沿面就是圖中加粗的部分。

Pareto前沿面的求解-多目標轉單目標

我們可以將上述的嶺迴歸寫成如下形式:
minbAx22+λx22λ0\min{||b-Ax||^2_2+\lambda ||x||_2^2};\lambda\geq0
這就是我們常見的嶺迴歸的形式,其實就是使用參數λ\lambda,將多目標優化轉化成了單目標無約束優化。便利這個λ\lambda,我們就可以取到前沿面上的所有的點,λ=0\lambda=0λ=inf\lambda=inf時的點已經畫在了圖上。
在這裏插入圖片描述
但是很多時候,即使是轉化成了單目標優化我們也無法求出前沿面上的所有點。

嶺迴歸的另一種等價形式

上面我們已經給出了兩種嶺迴歸的形式,這裏再給出另一種,這三種形式也就是我們常用的多目標向單目標轉化的方法

minbAx22min ||b-Ax||_2^2
s.t.x22κs.t. ||x||_2^2\leq \kappa
即我們主要優化其中一個目標,而使得另一個目標成爲優化的限制條件。同樣的在這裏如果κ=0\kappa=0,那麼是上圖中λ=inf\lambda=inf的點,而κ=inf\kappa=inf對應λ=0\lambda=0的點。這也給我們提供了一種將約束去掉,將問題轉化爲無約束的方法,從而導出了拉格朗日乘子的概念。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章