卷積神經網絡(CNN)之入門篇

一、CNN的作用

  • 1、在圖片的分類問題中,我們依舊需要根據訓練集去判斷測試集屬於哪一個類別。圖片是由不同的像素點組成,同一種動物不同的形態都會導致像素值的不同,通過CNN我們可以彙總得出圖片中動物的整體特徵,從而進行比對。在這裏插入圖片描述
  • 2、給定一張圖片,是車還是馬未知,是什麼車也未知,現在需要模型判斷這張圖片裏具體是一個什麼東西,輸出結果爲:如果是車 那是什麼車
  • 3.依據少量的特徵識別出圖片的類別,在下圖中,我們只可以看見貓的一隻眼睛,兩隻耳朵和一個嘴巴,沒有其餘的身體特徵;我們人類可以一眼識別出這隻貓,計算機如何根據少量的特徵進行識別呢?
    在這裏插入圖片描述

二、CNN簡介

  • 1、CNN的概念:卷積神經網絡是一種帶有卷積結構的深度神經網絡,卷積結構可以減少網絡佔用的內存量,三個關鍵的操作分別是局部感受野(每一次只取一小部分)、權值共享(相當於一個濾波器)、pooling層(適當的降維),有效的減少了參數,緩解了過擬合的問題。
    (1)局部感受野:由於圖像的空間聯繫是局部的,每個神經元不需要對全部的圖像做感受,只需要感受局部特徵即可,然後在更高層將這些感受得到的不同的局部神經元綜合起來就可以得到全局的信息了,這樣可以減少連接的數目。
    (2)權值共享(不同的權值相當於不同的特徵進行過濾):不同神經元之間的參數共享可以減少需要求解的參數,使用多種濾波器去卷積圖像就會得到多種特徵映射。權值共享其實就是對圖像用同樣的卷積核進行卷積操作,也就意味着第一個隱藏層的所有神經元所能檢測到處於圖像不同位置的完全相同的特徵。其主要的能力就能檢測到不同位置的同一類型特徵,也就是卷積網絡能很好的適應圖像的小範圍的平移性,即有較好的平移不變性(比如將輸入圖像的貓的位置移動之後,同樣能夠檢測到貓的圖像)
  • 2、CNN的本質:本質還是一個多層感知機
  • 3、CNN 區別於 全連接神經網絡:進行局部連接、權值共享的方式,降低模型的複雜度,減少過擬合的風險;減少了權值的數量,使得網絡易於優化。
    全連接層有多大通過下圖體會

在這裏插入圖片描述

  • 4、CNN的整體網絡結構:
    (1)卷積神經網絡是一種多層監督的神經網絡,隱含層(卷積層+池採樣層)是CNN特徵提取功能的核心模塊。
    (2)通過梯度下降法最小化損失函數對網絡中的權重參數逐層反向調節,多次迭代訓練提高精度。
    (3)卷積神經網絡的組成由低隱層和高隱層組成;低隱層由卷積層和最大池採樣層交替組成;高隱層是全連接層對應傳統多層感知器中的隱含層和邏輯迴歸分類器。
    (4)第一個全連接層的輸入是由卷積層和子採樣層進行特徵提取得到的特徵圖像。最後一層輸出層是一個分類器(邏輯迴歸、Softmax迴歸、支持向量機)對輸入圖像進行分類。
  • 5、CNN神經網絡的結構(具體在另一篇敘述)
    (1)數據的輸入層:對數據做一些處理,比如去均值(把輸入數據各個維度都中心化爲0,避免數據過多偏差,影響訓練效果)、歸一化(把所有的數據都歸一到同樣的範圍)、PCA/白化等等。CNN只對訓練集做“去均值”這一步。
    (2)中間處理層:卷積計算層進行線性的乘積求和(CONV),激活層(RELU等激活函數),池化層進行區域取平均或最大值等操作(POOLING)
    (3)全連接層(當前採用全局平均池化層)
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章