最優化理論之牛頓法

1、泰勒展開式

泰勒展開式是用多項式來近似表示函數在某點周圍的情況。

對於一個函數在x=a處的展開式,這個展開式在x=a附近對函數的逼近是最精確的,離a越遠,這個公式就越不精確。實際函數值和多項式的偏差稱爲泰勒公式的餘項。



2、方向導數和偏導數

方向導數(directional derivative)的通俗解釋是:我們不僅要知道函數在座標軸方向上的變化率(即偏導數),而且還要設法求得函數在其他特定方向上的變化率。而方向導數就是函數在其他特定方向上的變化率。

對於二維函數,任意方向的導數可以如下定義:


對於高維函數,我們可以同理推得,我們可以通過求得目標方向與各個方向之間的夾角,然後通過各維上的偏導數組合得到方向導數。



3、函數梯度:

對於一個多維函數,梯度是它的各界偏導數的值組成的向量。

函數{\displaystyle \varphi =2x+3y^{2}-\sin(z)}\varphi=2x+3y^2-\sin (z)的梯度爲:

{\displaystyle \nabla \varphi ={\begin{pmatrix}{\frac {\partial \varphi }{\partial x}},{\frac {\partial \varphi }{\partial y}},{\frac {\partial \varphi }{\partial z}}\end{pmatrix}}={\begin{pmatrix}{2},{6y},{-\cos(z)}\end{pmatrix}}}

\nabla \varphi = \begin{pmatrix}{\frac{\partial \varphi}{\partial x}},  {\frac{\partial \varphi}{\partial y}}, {\frac{\partial \varphi}{\partial z}}\end{pmatrix} =\begin{pmatrix}{2},  {6y}, {-\cos (z)}\end{pmatrix}


4、海森矩陣:一個多變量實值函數的二階偏導數組成的方塊矩陣

H(f)={\begin{bmatrix}{\frac  {\partial ^{2}f}{\partial x_{1}^{2}}}&{\frac  {\partial ^{2}f}{\partial x_{1}\,\partial x_{2}}}&\cdots &{\frac  {\partial ^{2}f}{\partial x_{1}\,\partial x_{n}}}\\\\{\frac  {\partial ^{2}f}{\partial x_{2}\,\partial x_{1}}}&{\frac  {\partial ^{2}f}{\partial x_{2}^{2}}}&\cdots &{\frac  {\partial ^{2}f}{\partial x_{2}\,\partial x_{n}}}\\\\\vdots &\vdots &\ddots &\vdots \\\\{\frac  {\partial ^{2}f}{\partial x_{n}\,\partial x_{1}}}&{\frac  {\partial ^{2}f}{\partial x_{n}\,\partial x_{2}}}&\cdots &{\frac  {\partial ^{2}f}{\partial x_{n}^{2}}}\end{bmatrix}}

5、牛頓法步驟:



發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章