做目標檢測時我們經常用到voc 2007, voc 2012 數據集,今天就來整理一下。
數據集的下載地址: https://pjreddie.com/projects/pascal-voc-dataset-mirror/
voc 2007
數據集包含 訓練集:5011 張,測試集:4952張,共9963張,20個類。
20個類分別爲:
aeroplane
bicycle
bird
boat
bottle
bus
car
cat
chair
cow
diningtable
dog
horse
motorbike
person
pottedplant
sheep
sofa
train
tvmonitor
VOC2007 ,我們解壓訓練集後看到的文件目錄:
目錄的結構如下:
├── Annotations # 裏面存放 .xml 文件,圖片的標籤,比如座標位置信息等。
├── ImageSets # 這個目錄下有三個文件夾,文件夾存放的都是 .txt 文件,類別標籤
│ ├── Layout
│ ├── Main # Main 目錄下
│ └── Segmentation
├── JPEGImages # 圖像文件 .jpg 格式
├── labels
├── SegmentationClass # 存放的是圖片文件,分割後的圖片
└── SegmentationObject # 存放的是圖片文件,分割後的圖片
Annotations:存放 xml格式文件,每一個xml文件名對應JPEGImages 中的一張圖片。xml文件裏是對圖片的解釋,想了解可以自己看。
ImageSets:裏面有三個文件夾Layout,Main,Segmentation
- layout:存放的是人體部位的數據
- Main:存放物體識別的分類數據,裏面有 xx_train.txt, xx_test.txt , xx_trainval.txt, xx_val.txt 文件,xx表示分類,總共20類。
- Segmentation:存放可用於分割的數據
我們做目標檢測,只需要關注Main文件夾即可。
voc 2012
下載地址:http://host.robots.ox.ac.uk/pascal/VOC/voc2012/VOCtrainval_11-May-2012.tar
voc 2012 數據集是voc 2007的升級版,一共11530張圖片,數據集分爲20類(包含背景21)。
人:人
動物:鳥、貓、牛、狗、馬、羊
車輛:飛機、自行車、船、巴士、汽車、摩托車、火車
室內:瓶、椅子、餐桌、盆栽植物、沙發、電視/監視器
voc2012 數據集和2007結構是一樣的,文件夾存放的東西也類似:
├── Annotations # .xml 文件,文件裏面是對圖片的解釋
├── ImageSets # 裏面包含四個文件,文件夾下面存放 .txt文件
│ ├── Action
│ ├── Layout
│ ├── Main
│ └── Segmentation
├── JPEGImages # 原圖片
├── labels
├── SegmentationClass # 分割後的圖片
└── SegmentationObject # 分割後的圖片
ImageSets 目錄下:
- Action:存放的是人的動作(例如running、jumping等等,這也是VOC challenge的一部分)
- Layout:存放的是具有人體部位的數據(人的head、hand、feet等等,這也是VOC challenge的一部分)
- Main:存放的是圖像物體識別的數據,總共分爲20類
- Segmentation:存放的是可用於分割的數據
參考:
https://blog.csdn.net/qq_41185868/article/details/79927556
https://blog.csdn.net/weixin_42142612/article/details/83142213