要運行caffe,需要先創建一個模型(model),如比較常用的Lenet,Alex等, 而一個模型由多個屋(layer)構成,每一屋又由許多參數組成。所有的參數都定義在caffe.proto這個文件中。要熟練使用caffe,最重要的就是學會配置文件(prototxt)的編寫。
層有很多種類型,比如Data,Convolution,Pooling等,層之間的數據流動是以Blobs的方式進行。
今天我們就先介紹一下數據層.
數據層是每個模型的最底層,是模型的入口,不僅提供數據的輸入,也提供數據從Blobs轉換成別的格式進行保存輸出。通常數據的預處理(如減去均值, 放大縮小, 裁剪和鏡像等),也在這一層設置參數實現。
數據來源可以來自高效的數據庫(如LevelDB和LMDB),也可以直接來自於內存。如果不是很注重效率的話,數據也可來自磁盤的hdf5文件和圖片格式文件。
// 輸入層的定義:
name:
"LeNet"
(網絡的名字)
layer { (定義一個網絡層)
name:
"data"
(網絡層的名字爲 data)
type:
"Input"
(網絡層的類型,輸入)
top:
"data"
(該網絡層的輸出叫 data )
input_param { shape: { dim: 64 dim: 1 dim: 28 dim: 28 } } }(64張圖像爲一批,28*28大小)
}
//讀取這批數據維度:64 1 28 28
所有的數據層的都具有的公用參數:先看示例
layer {
name: "cifar"
type: "Data"
top: "data"
top: "label"
include {
phase: TRAIN
}
transform_param {
mean_file: "examples/cifar10/mean.binaryproto"
}
data_param {
source: "examples/cifar10/cifar10_train_lmdb"
batch_size: 100
backend: LMDB
}
}
name: 表示該層的名稱,可隨意取
type: 層類型,如果是Data,表示數據來源於LevelDB或LMDB。根據數據的來源不同,數據層的類型也不同(後面會詳細闡述)。一般在練習的時候,我們都是採 用的LevelDB或LMDB數據,因此層類型設置爲Data。
top或bottom: 每一層用bottom來輸入數據,用top來輸出數據。如果只有top沒有bottom,則此層只有輸出,沒有輸入。反之亦然。如果有多個 top或多個bottom,表示有多個blobs數據的輸入和輸出。
data 與 label: 在數據層中,至少有一個命名爲data的top。如果有第二個top,一般命名爲label。 這種(data,label)配對是分類模型所必需的。
include: 一般訓練的時候和測試的時候,模型的層是不一樣的。該層(layer)是屬於訓練階段的層,還是屬於測試階段的層,需要用include來指定。如果沒有include參數,則表示該層既在訓練模型中,又在測試模型中。
Transformations: 數據的預處理,可以將數據變換到定義的範圍內。如設置scale爲0.00390625,實際上就是1/255, 即將輸入數據由0-255歸一化到0-1之間
reference:
[1]. https://blog.csdn.net/weixin_34096182/article/details/85787069