吳恩達機器學習筆記2--神經網絡與BP算法

神經網絡出現的原因

在上一篇博客中吳恩達系列視頻筆記1–迴歸與分類，我們學習了幾種比較強大的模型，可以解決一些基本問題，如房價預測，腫瘤的分類，而且所有問題都可以大致歸爲分類和迴歸兩類，既然所有的問題都能解決，那爲什麼我們還要學習神經網絡？
拿目前較熱的計算機視覺來說，當我們處理圖像時只處理50x50px的圖像，每個像素點作爲特徵輸入，共有2500個特徵，如果我們使用彩色圖像，每個像素點都包含RGB三個值，此時應該有7500個特徵，所有特徵我們只做二次項組合就有7500x7500個特徵組合，這時我們需要處理的特徵量，無論是通過篩選後使用還是直接使用都是之前的模型無法承受的,因此我們需要更爲強大的神經網絡智能化的提取更具表達力的特徵。我們通過對神經網絡原理的介紹來具體研究神經網絡是如何智能化提取特徵。

1.神經網絡原理

正向傳播過程

$a_{1}^{(2)}=g(\Theta _{10}^{(1)}x_{0}+\Theta _{11}^{(1)}x_{1}+\Theta _{12}^{(1)}x_{2}+\Theta _{13}^{(1)}x_{3})\\[2mm] a_{2}^{(2)}=g(\Theta _{20}^{(1)}x_{1}+\Theta _{21}^{(1)}x_{1}+\Theta _{22}^{(1)}x_{2}+\Theta _{23}^{(1)}x_{3})\\[2mm] a_{3}^{(2)}=g(\Theta _{30}^{(1)}x_{0}+\Theta _{31}^{(1)}x_{1}+\Theta _{32}^{(1)}x_{2}+\Theta _{33}^{(1)}x_{3})\\[2mm] h_{\theta }(x)=a_{1}^{(3)}=g(\Theta _{10}^{(2)}a_{0}^{(2)}+\Theta _{11}^{(2)}a_{1}^{(2)}+\Theta _{12}^{(2)}a_{2}^{(2)}+\Theta _{13}^{(2)}a_{3}^{(2)})$
輸入的特徵爲x1,x2,x3,theta的計算實質是爲我們提取了少量的具代表性的特徵a1,a2,a3,以往的邏輯迴歸以及迴歸問題中都是需要依賴我們的經驗來選取特徵，神經網絡這種自動提煉特徵的方式使我們擺脫了傳統經驗提取特徵的方式，使特徵的提取更加科學化智能化。並且根據公式，我們能很明顯的看到每層的傳播規則相同，公式相似只是參數不同，也就意味着我們可以通過矩陣乘法計算一次性計算一層的所有公式加速計算速度。

反向傳播算法

反向傳播過程公式
$\delta _{1}^{(4)}=y^{(i)}-a_{1}^{(4)}\\[2mm] \delta _{1}^{(3)}=\delta _{1}^{(4)}\theta _{11}^{(3)}\\[2mm] \delta _{2}^{(3)}=\delta _{1}^{(4)}\theta _{12}^{(3)}\\[2mm] \delta _{1}^{(2)}=\delta _{1}^{(3)}\theta _{11}^{(2)}+\delta _{2}^{(3)}\theta _{21}^{(2)}\\[2mm] \delta _{2}^{(2)}=\delta _{1}^{(3)}\theta _{12}^{(2)}+\delta _{2}^{(3)}\theta _{22}^{(2)}$
其中delta是每個節點的誤差值

梯度檢驗

實際上在實現梯度下降法時，總會產生各種錯誤，使理論值和實際值相差較大，對模型結果產生較大影響。這時我們可以通過梯度檢驗來發現這種錯誤。示例公式如下：
$\frac{\partial }{\partial \theta _{1}}J(\theta )\approx \frac{J(\theta _{1}+\epsilon ,\theta _{2},...,\theta _{n})-J(\theta _{1}-\epsilon ,\theta _{2},...,\theta _{n})}{2\epsilon }$

吳恩達機器學習筆記2--神經網絡與BP算法

神經網絡出現的原因

1.神經網絡原理

正向傳播過程

反向傳播算法

梯度檢驗

vue項目獲取富文本編輯器wangEditor內容導出爲word（html轉word格式並下載）

dotnet C# 創建 X11 應用時設置窗口背景顏色

Navicat安裝與激活教程

TDengine docker安裝方法

vue3組件通信與props

sapui5

Alpine Linux apk add DNS lookup error

部分JDK版本的發佈時間

工作中用到的腳本合集

合併代碼時Beyond Compare設置

彙編語言(王爽)--第一章基礎知識

彙編語言(王爽)--第四章第一個程序

彙編語言(王爽)--第二章寄存器

吳恩達機器學習筆記2--神經網絡與BP算法

自然語言處理的應用

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結