深度學習| 神經網絡初步

原創

2023-03-30 14:03

線性分類器

線性分類器比如邏輯迴歸、線性SVM，我們會拿到一個決策邊界

線性分類器得分函數

圖像數據（32 * 32 * 3的輸入矩陣）——圖像數據權重/參數f(x, W) ——> CIFAR-10中的10個類別的得分向量

f(x, W) = Wx （10*1 = 10* 3072 3072*1），其中W叫做參數或者權重，f(x, W) 叫做假設函數x -> y映射關係的函數；

線性分類器得分函數

損失函數也叫代價函數/cost function 、客觀度/objective

衡量和標準答案差異的函數

給定w，可以由像素映射到類目得分；
可以調整參數/ 權重W，使得映射的結果和實際類別吻合；
損失函數是用來衡量吻合度的；

損失函數1：hinge loss / 支持向量機損失

對於訓練集中的第i張圖片數據x_i是一個向量；
在W下會有一個得分結果向量f(x_i, W) 是一個向量；
第j類的得分爲我們記作f(x_i, W)_j是一個標量scalar；
則在該樣本上的損失我們由下列公式計算得到；

假設我們現在有三個類別，而得分函數計算某張圖片的得分爲f(x_i, W) = [13, -7, 11]，而實際的結果是第一類(y_i= 0)；

假設△ = 10，上面的公式把錯誤類別(j != y_i) 都遍歷了一遍，求值加和： L_i = max(0, -7 -13 + 10) + max(0, 11 - 13 + 10)

因爲是線性模型，因此可以簡化成：

線性分類器得分函數

損失函數2：交叉熵損失（softmax分類器）

對於訓練集中的第i 張圖片數據x_i ；
在W下會有一個得分結果向量f_yi；
則損失函數記作：

2種損失函數的理解

通用的學習框架

神經網絡

一般神經網絡的結構

從邏輯迴歸到神經元“感知器”

添加少量隱層 => 淺層神經網絡

增多中間層 => 深度神經網絡（DNN）

神經網絡非線性切分

神經元完成【邏輯與】

神經元完成【邏輯或】

神經網絡非線性切分

對線性分類器的AND 和OR的組合

完美對平面樣本點分佈進行分類

神經網絡表達力與過擬合

理論上說單隱層神經網絡可以逼近任何連續函數（只要隱層的神經元個數足夠多）；
雖然從數學上表達能力一致，但是很多隱藏層的神經網絡比單隱藏層的神經網絡工程效果好很多；
對於一些分類數據（比如CTR預估裏），3層神經網絡效果優於2層神經網絡，但是如果把層數再不斷增加（4,5,6層），對最後結果的幫助就沒有那麼大的跳變了；
圖像數據比較特殊，是一種深層（多層次）的結構化數據，深層次的卷積神經網絡，能夠更充分和準確地把這些層級信息表達出來；

提升隱層層數或者隱層神經元個數，神經網絡“容量”會變大，空間表達力會變強；
過多的隱層和神經元節點，會帶來過擬合問題；
不要試圖通過降低神經網絡參數量來減緩過擬合，用正則化或者dropout；

神經網絡結構

傳遞函數

BP算法

“正向傳播”求損失，“反向傳播”回傳誤差；
根據誤差信號修正每層的權重；

BP算法也叫δ算法；
以3層的感知器爲例

SGD

誤差E有了，怎麼調整權重讓誤差不斷減小？

E是權重W的函數，我們需要找到使得函數值最小的W；

BP算法例子

前向（前饋）運算

反向傳播

反向傳播與參數更新

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

HTML頁面關於高分屏的設置

記錄一個HTML頁面關於高分屏的踩到的坑。所謂高分屏，就是在同樣大小的屏幕面積上顯示更多的像素點，這樣可以呈現更好的可視效果的屏幕。例如，我的筆記本是15.6寸，理論上它的屏幕分辨率應該是1920 x 1080像素，但實際上我的筆記本屏幕

2024-05-04 14:31:10

DAPPER 事務 TRANSACTION

https://www.cnblogs.com/friend/p/16754184.html\ public async Task<int> Save(long moldProducedProductId, List<MoldStan

2024-05-04 14:29:20

[MDP.AspNetCore] 實作OAuth協定SSO Server/Client專案範例

團隊負責的系統變多的時候，使用SSO Server提供統一身分驗證，讓團隊只需要維護一份用戶資料及一個身分驗證服務。除了減少團隊維護成本之外，也讓使用者不用記憶多個站臺的帳號密碼，提供更好的使用者體驗。本篇文章，介紹使用MDP.AspNe

2024-05-04 14:23:49

Redis官方開源的可視化管理工具 - RedisInsight

前言今天大姚給大家推薦一款Redis官方開源的可視化管理工具：RedisInsight。 Redis介紹 Redis (Remote Dictionary Server) 是一個使用 C 語言編寫的，開源的 (遵守 BSD 協議) 高性

2024-05-04 14:21:49

Python 潮流週刊#49：谷歌裁員 Python 團隊，微軟開源 MS-DOS 4.0

本週刊由 Python貓出品，精心篩選國內外的 250+ 信息源，爲你挑選最值得分享的文章、教程、開源項目、軟件工具、播客和視頻、熱門話題等內容。願景：幫助所有讀者精進 Python 技術，並增長職業和副業的收入。本期週刊分享了 12

豌豆花下貓

2024-05-04 14:19:09

HarmonyOS 垂直方向內容滾動條實現

概述 Swiper組件是一個用戶界面元素，用於在垂直方向上滾動內容。它通過遍歷一個數據集合，爲每一項創建一個可滾動的文本項。代碼實現以下是Swiper組件的實現代碼： Swiper(){ ForEach(searchSwiper,

2024-05-04 14:05:08

基於SSM的倉庫進銷存系統畢業設計論文【範文】

摘要隨着信息技術的不斷髮展，企業對於倉儲管理的要求日益提高。爲了提升倉庫管理的自動化和智能化水平，本研究設計並實現了一個基於Spring、Spring MVC和MyBatis (SSM) 框架的在倉庫進銷存系統。該系統旨在爲企業提供一個高

2024-05-04 14:03:17

基於SSM的在線考試系統畢業設計論文【範文】

摘要隨着信息技術的飛速發展，網絡教學逐漸成爲教育行業的重要組成部分。在線考試系統作爲網絡教學平臺的關鍵模塊之一，其便捷性、高效性和公正性受到廣泛關注，基於SSM框架的在線考試系統旨在提供一個穩定、可靠並且易於維護的在線考試環境，以滿足現代

2024-05-04 14:03:17

CSS & JS Effect – 用 wheel 模擬 scroll

前言在用 JavaScript 實現 position sticky 文章中，我提到了用 wheel 來模擬 scroll 效果。這篇來說說具體怎麼實現，挺簡單的哦。 Preparation table.html <div c

2024-05-04 13:59:16

python包：torchsummary

利用torchsummary觀察每一層的情況 1）按照方式 pip install torchsummary 2）

2024-05-04 13:56:56

Windows使用WSL2及docker(Ubuntu22.04 LTS)

WSL2初始化 1.換源 #1 cp /etc/apt/sources.list /etc/apt/sources.list.bak #2 vim /etc/apt/sources.list # 清空原源並替換成以下源 # deb-src

臨冬城城主

2024-05-04 13:52:56

學習Mysql 你應該懂得

1、日誌系統：平時在設計系統時可以借鑑一下參考下面文章 https://www.cnblogs.com/ScarecrowAnBird/p/18163444 2、索引：提高性能利器 3、鎖：提高併發能力小絕招 https://ww

落葉已歸根

2024-05-04 13:45:25

mysql 鎖，和加鎖機制

背景間隙鎖是MySQL在RR可重複讀隔離級別下用來修復幻讀才引入的一種鎖，間隙鎖也只有在RR可重複讀隔離級別下才會存在，如果是在RC讀已提交隔離級別下，是沒有間隙鎖的存在的。另外，我們也知道，幻讀這種現象也只有在當前讀的時候纔會發生，在一致

落葉已歸根

2024-05-04 13:45:25

深入 Django 模型層：數據庫設計與 ORM 實踐指南

title: 深入 Django 模型層：數據庫設計與 ORM 實踐指南 date: 2024/5/3 18:25:33 updated: 2024/5/3 18:25:33 categories: 後端開發 tags: Djang

2024-05-04 13:38:24

[轉帖]Introducing Exadata Cloud@Customer X10M

https://blogs.oracle.com/database/post/introducing-exadata-cloudcustomer-x10m Extreme Scale with Dramatically

濟南小老虎

2024-05-04 13:29:33

24小時熱門文章

DAPPER 事務 TRANSACTION

最新文章

最新評論文章