卷積神經網絡

原創

2020-03-28 23:46

神經元

神經網絡由大量的神經元相互連接而成。每個神經元接受線性組合的輸入後，再將其放在非線性的激活函數中計算後輸出。每兩個神經元連接線上的值代表加權值，稱之爲權重。 不同的權重和激活函數 ，就會導致神經元有不同的輸出。神經網絡的每個神經元如下所示。
一開始爲了簡單，人們把激活函數定義成一個線性函數，比如一個簡單的線性激活函數是g(z)=z。後來實際應用中發現，線性激活函數太過侷限，於是人們引入了非線性激活函數。
常用的非線性激活函數有sigmoid、tanh、relu等，前兩者比較常見於全連接層，後者relu常見於卷積層。sigmoid的函數表達式如下。
sigmoid函數g(z)的圖形表示如下。
也就是說，sigmoid函數的功能是相當於把一個實數壓縮至0到1之間。當z是非常大的正數時，g(z)會趨近於1，而z是非常小的負數時，g(z)會趨近於0。壓縮至0到1的用處是可以把激活函數看作一種分類的概率，比如激活函數的輸出爲0.9的話便可以解釋爲90%的概率爲正樣本。

神經網絡

將單個神經元組織在一起，便形成了神經網絡。下圖便是一個三層神經網絡結構，圖中最左邊的層稱之爲輸入層，最右邊的層稱之爲輸出層，中間的叫隱藏層。

輸入層，接受大量非線形輸入信息的層，輸入的信息稱爲輸入向量。
輸出層，形成輸出結果的層。輸出的信息稱爲輸出向量。
隱藏層，輸入層和輸出層之間的各個層。

每一層都可能由單個或多個神經元組成，每一層的輸出將會作爲下一層的輸入數據。
此外，輸入層和隱藏層都存在一個偏置單元，所以上圖中也增加了偏置項x0和a0。針對上圖，有如下公式。

卷積神經網絡

卷積神經網絡層次結構如下。

最左邊是輸入層，對數據做一些處理，比如去均值、歸一化等等。CNN只對訓練集做去均值這一步。
中間有CONV，即卷積計算層；RELU，即激勵層，激勵層使用的ReLU是激活函數的一種；POOL，即池化層，取區域平均值或最大值。
最右邊是FC，即全連接層

對圖像中不同窗口內的數據和濾波矩陣做內積的操作就是所謂的卷積操作，也是卷積神經網絡的名字來源。非嚴格意義上來講，下圖中紅框框起來的部分便可以理解爲一個濾波器，即帶着一組固定權重的神經元。多個濾波器疊加便成了卷積層。
在下圖對應的計算過程中，輸入是一定大小的數據，它和濾波器做內積後等到新的二維數據。不同的濾波器會得到不同的輸出數據。如果想提取圖像的不同特徵，則用不同的濾波器，提取想要的關於圖像的特定信息，比如顏色深淺或輪廓。
在CNN中，濾波器對局部輸入數據進行卷積計算。每計算完一個數據窗口內的局部數據後，數據窗口不斷平移滑動，直到計算完所有數據。這個過程中，有以下幾個參數。

深度：神經元個數，即濾波器個數，決定輸出的厚度。
步長：決定滑動多少步可以到邊緣。
填充值：在外圍邊緣補充的0的圈數，方便從初始位置以步長爲單位可以剛好滑倒末尾位置。

每次濾波器都是針對某一局部的數據窗口進行卷積，這就是所謂的CNN中的局部感知機制。與此同時，數據窗口滑動，導致輸入在變化，但中間濾波器的權重是固定不變的，這個權重不變即所謂的CNN中的權重共享機制。
在實際梯度下降中，sigmoid容易飽和，造成終止梯度傳遞，且沒有0中心化。可以使用另外一個激活函數：ReLU。ReLU的優點是收斂快，求梯度簡單。它對於輸入的負值，輸出全爲0，對於正值，原樣輸出。
池化層可以將一幅大的圖像縮小，同時又保留其中的重要信息。通常情況下，池化都是2乘以2大小，比如對於最大池化來說，就是取輸入圖像中2乘以2大小的塊中的最大值，作爲結果的像素值，相當於將原始圖像縮小了4倍。同理，對於平均池化來說，就是取2*2大小塊的平均值作爲結果的像素值。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

Stable Diffusion中的embedding

Stable Diffusion中的embedding 嵌入，也稱爲文本反轉，是在 Stable Diffusion 中控制圖像樣式的另一種方法。在這篇文章中，我們將學習什麼是嵌入，在哪裏可以找到它們，以及如何使用它們。什麼是嵌入embe

2024-04-25 21:31:13

京東廣告研發 —— 京東推薦廣告排序機制演化

1、序言：廣告排序機制的前世今生 1.1、簡介：廣告排序機制在線廣告是國內外各大互聯網公司的重要收入來源之一，而在線廣告與傳統廣告最大的區別就在於其超大規模的實時競價環境：數以萬計的廣告主在一天內可以參與億級別的流量競拍。在這複雜的實

2024-04-24 23:17:14

03-爲啥大模型LLM還沒能完全替代你？

1 不具備記憶能力的它是零狀態的，我們平常在使用一些大模型產品，尤其在使用他們的API的時候，我們會發現那你和它對話，尤其是多輪對話的時候，經過一些輪次後，這些記憶就消失了，因爲它也記不住那麼多。 2 上下文窗口的限制大模型對其inpu

2024-04-23 01:07:00

輕鬆復現一張AI圖片

輕鬆復現一張AI圖片現在有一個非常漂亮的AI圖片，你是不是想知道他是怎麼生成的？今天我會交給大家三種方法，學會了，什麼圖都可以手到擒來了。需要的軟件在本教程中，我們將使用AUTOMATIC1111 stable diffusio

2024-04-22 21:30:45

01-大語言模型發展

AI大模型的相關的一些基礎知識，一些背景和基礎知識。多模型強應用AI 2.0時代應用開發者的機會。 0 大綱 AI產業的拆解和常見名詞應用級開發者，在目前這樣一個大背景下的一個職業上面的一些機會實戰部分的，做這個agent，即所謂智

2024-04-22 01:12:50

AI從入門到入門之手寫數字識別模型java方式Dense全連接神經網絡實現

前言：授人以魚不如授人以漁.先學會用，在學原理，在學創造，可能一輩子用不到這種能力，但是不能不具備這種能力。這篇文章主要是介紹算法入門Helloword之手寫圖片識別模型java中如何實現以及部分解釋。目前大家對於人工智能-機器學習-神經網

2024-04-19 23:17:21

深入解析大模型NLP LLaMa

在人工智能和自然語言處理（NLP）領域，LLaMa（Language-Model-driven Learning, aMplification and aDAptation）流程已經成爲處理大規模模型訓練的關鍵技術。它基於語言模型的學習、增

2024-04-18 11:29:54

京東廣告研發——效率爲王：廣告統一檢索平臺實踐

1、系統概述實踐證明，將互聯網流量變現的在線廣告是互聯網最成功的商業模式，而電商場景是在線廣告的核心場景。京東服務中國數億的用戶和大量的商家，商品池海量。平臺在兼顧用戶體驗、平臺、廣告主收益的前提推送商品具有挑戰性。京東廣告檢索平臺

2024-04-25 23:17:47

大模型區域落地再加速！百度“文心中國行”西部首站落地成都錦江

4 月 24 日，“文心中國行”西部地區首站落地成都錦江。成都市錦江區白鷺灣新經濟總部功能區、錦江區投資促進局與百度飛槳攜手合作，打造成都人工智能的新產業、新模式、新業態。來自成都政產學研各界的領導、專家、企業嘉賓，共同探討如何降低 AI

2024-04-25 11:41:53

文心中國行走進成都！4 月 24 日一起把握大模型時代的產業新機遇

4 月 24 日，文心中國行將走進成都。屆時，政府、企業與高校的相關專家和業界同仁將現場分享生成式人工智能與大模型最新進展，從人工智能政策解讀、大模型技術，到產業創新應用的實踐案例，讓參會者全方位瞭解大模型時期的發展與創新機遇。大會還特別

2024-04-23 11:41:07

文心大模型“你說我畫”：PaddleHub與PaddleSpeech的協同實踐

在人工智能領域中，自然語言處理和計算機視覺是兩個非常活躍的研究方向。隨着深度學習技術的發展，這兩個領域之間的交叉融合產生了許多令人興奮的應用場景。其中，“你說我畫”就是這樣一個結合自然語言處理和計算機視覺技術的創新應用。 “你說我畫”的核心

2024-04-22 11:29:20

探索時間序列大模型：TimeGPT的魅力與實踐

在數據科學的各個領域中，時間序列分析一直扮演着重要角色。無論是預測股票價格、氣候變化，還是分析醫療數據，時間序列模型都發揮着不可或缺的作用。然而，傳統的時間序列分析方法在處理複雜數據時常常面臨諸多挑戰，如數據稀疏性、非線性關係等。爲了應對這

2024-04-22 11:29:17

京東廣告研發——AIGC在京東廣告創意的技術應用

一、前言電商廣告圖片不僅能夠抓住消費者的眼球，還可以傳遞品牌核心價值和故事，建立起與消費者之間的情感聯繫。然而現有的廣告圖片大多依賴人工製作，存在效率和成本的限制。儘管最近AIGC技術取得了卓越的進展，但其在廣告圖片的應用還存在缺乏

2024-04-22 11:16:30

Create 2024 分論壇：百度大模型安全解決方案護航開發者一起創造未來

4月16日，百度Create AI開發者大會在深圳國際會展中心（寶安）舉行，大會以“創造未來”爲主題，匯聚了當前科技和產業革命中的開發者先鋒力量。自去年3月16日發佈知識增強大語言模型文心一言以來，百度不斷推動文心大模型的升級迭代，每一次版

2024-04-19 21:33:25

AI大模型應用架構（ALLMA）白皮書解讀

隨着人工智能技術的不斷髮展，AI大模型成爲推動生產、生活方式變革，助推產業智能化轉型升級，驅動數字經濟高質量發展等社會經濟發展方面的新引擎。爲了全面展示AI大模型的發展全貌，爲各界提供新思路，本文將對AI大模型應用架構（ALLMA）白皮書進

2024-04-19 11:29:39

24小時熱門文章

最新文章

最新評論文章