【caffe】caffe層解讀系列——slice和concat實現MultiTask

原創

q295684174

2020-06-22 18:20

轉載地址：http://blog.csdn.net/shuzfan/article/details/54565776

最近一段時間MultiTask網絡比較流行，比如做人臉檢測的時候，一個網絡完成（人臉和非人臉）二分類任務的同時也要進行boudingbox迴歸或者人臉關鍵點回歸。

以人臉檢測MTCNN爲例，一個網絡包含三個任務。訓練的時候，一個batch中的圖片，一部分用於二分類、一部分用於boundingbox 迴歸，一部分用於關鍵點回歸。這種較複雜的樣本組合完全可以通過slice和concat層來快速實現。

———————— Concat —————————

concat層實現輸入數據的拼接。
該層有兩個相同作用的參數：

message ConcatParameter {
  //指定拼接的維度，默認爲1即以channel通道進行拼接;支持負索引，即-1表示最後一個維度
  optional int32 axis = 2 [default = 1];

  // 以後會被棄用，作用同axis一樣，但不能指定爲負數
  optional uint32 concat_dim = 1 [default = 1];
}

caffe中數據通常爲4個維度，即 num×channels×height×width，因此默認值1表示channels通道進行拼接。

使用方法如下

layer {
  name: "data_all"
  type: "Concat"
  bottom: "data_classfier"
  bottom: "data_boundingbox"
  bottom: "data_facialpoints"
  top: "data_all"
  concat_param {
    axis: 0
  }
}

除了拼接維度外的其它維度都必須相等。比如上面，輸入圖像均爲 24×24×3

————————— Slice —————————

既然有合併，那麼相應的也有拆分。slice層共有三個參數：

message SliceParameter {
  // 下面兩個指定沿哪個維度進行拆分，默認拆分channels通道
  optional int32 axis = 3 [default = 1];
  optional uint32 slice_dim = 1 [default = 1];

  // 指定拆分點
  repeated uint32 slice_point = 2;
}

現在我們就要把之前concat合併的數據按照原樣拆分：

layer {
  name: "data_each"
  type: "Slice"
  bottom: "data_all"
  top: "data_classfier"
  top: "data_boundingbox"
  top: "data_facialpoints"
  slice_param {
    axis: 0
    slice_point: 150
    slice_point: 200
  }
}

其中slice_point的個數必須等於top的個數減一。輸入的data_all維度爲 250×3×24×24

————————— MultiTask —————————

下面直接給一張網絡結構圖，大家就應該知道怎麼實現多數據MultiTask了。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

【caffe】caffe層解讀系列——slice和concat實現MultiTask

———————— Concat —————————

————————— Slice —————————

————————— MultiTask —————————

[轉帖]使用NMT和pmap解決JVM資源泄漏問題原創

Python實現大麥網搶票的四大關鍵技術點解析

Python 安裝庫指令大全

salesforce零基礎學習（一百三十八）零碎知識點小總結（十）

一款開源的.NET程序集反編譯、編輯和調試神器

關於接口協議，你必須要知道這些！

2020年上半年數據庫系統工程師考試

基於 Milvus + LlamaIndex 實現高級 RAG

【2024-05-21】以茶會友

【caffe】caffe之編譯錯誤

【Person Re-ID】SVDNet for Pedestrian Retrieval

【Person Re-ID】常用評測指標

【Person Re-ID】Large-scale Person Re-identification as Retrieval

【caffe】caffe層解讀系列——slice和concat實現MultiTask

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結