目標檢測數據集VOC 2007/2012 整理

做目標檢測時我們經常用到voc 2007, voc 2012 數據集,今天就來整理一下。

數據集的下載地址: https://pjreddie.com/projects/pascal-voc-dataset-mirror/

 

voc 2007

數據集包含 訓練集:5011 張,測試集:4952張,共9963張,20個類

20個類分別爲:

aeroplane
bicycle
bird
boat
bottle
bus
car
cat
chair
cow
diningtable
dog
horse
motorbike
person
pottedplant
sheep
sofa
train
tvmonitor 

VOC2007 ,我們解壓訓練集後看到的文件目錄:

 

目錄的結構如下:

├── Annotations            # 裏面存放 .xml 文件,圖片的標籤,比如座標位置信息等。
├── ImageSets             # 這個目錄下有三個文件夾,文件夾存放的都是 .txt 文件,類別標籤
│   ├── Layout
│   ├── Main                 # Main 目錄下
│   └── Segmentation
├── JPEGImages               # 圖像文件 .jpg 格式
├── labels
├── SegmentationClass     # 存放的是圖片文件,分割後的圖片
└── SegmentationObject    # 存放的是圖片文件,分割後的圖片

Annotations:存放 xml格式文件,每一個xml文件名對應JPEGImages 中的一張圖片。xml文件裏是對圖片的解釋,想了解可以自己看。

ImageSets:裏面有三個文件夾Layout,Main,Segmentation

  1. layout:存放的是人體部位的數據
  2. Main:存放物體識別的分類數據,裏面有 xx_train.txt, xx_test.txt , xx_trainval.txt, xx_val.txt 文件,xx表示分類,總共20類。
  3. Segmentation:存放可用於分割的數據

我們做目標檢測,只需要關注Main文件夾即可。

 

voc 2012

下載地址:http://host.robots.ox.ac.uk/pascal/VOC/voc2012/VOCtrainval_11-May-2012.tar

voc 2012 數據集是voc 2007的升級版,一共11530張圖片,數據集分爲20類(包含背景21)。

人:人

動物:鳥、貓、牛、狗、馬、羊

車輛:飛機、自行車、船、巴士、汽車、摩托車、火車

室內:瓶、椅子、餐桌、盆栽植物、沙發、電視/監視器

 

voc2012 數據集和2007結構是一樣的,文件夾存放的東西也類似:

├── Annotations             # .xml 文件,文件裏面是對圖片的解釋
├── ImageSets               # 裏面包含四個文件,文件夾下面存放 .txt文件
│   ├── Action 
│   ├── Layout
│   ├── Main
│   └── Segmentation
├── JPEGImages               # 原圖片
├── labels
├── SegmentationClass     # 分割後的圖片
└── SegmentationObject    # 分割後的圖片

 

ImageSets 目錄下:

  1. Action:存放的是人的動作(例如running、jumping等等,這也是VOC challenge的一部分)
  2. Layout:存放的是具有人體部位的數據(人的head、hand、feet等等,這也是VOC challenge的一部分)
  3. Main:存放的是圖像物體識別的數據,總共分爲20類
  4. Segmentation:存放的是可用於分割的數據

參考:

https://blog.csdn.net/qq_41185868/article/details/79927556

https://blog.csdn.net/weixin_42142612/article/details/83142213

 

 

 

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章