根據網上的資料,一位外國小哥整理的圖像數據集博客,整理該篇博文。原文地址如下:
Who is the best at X ?
http://rodrigob.github.io/are_we_there_yet/build/#datasets
圖像處理任務,以下5類
- 分類
- 目標識別
- 姿勢分析
- 語義標註
- 圖像分割
1. 分類
- MNIST 手寫數字識別28*28
- cifar10 10分類,輸入28283
- cifar100 100分類,輸入28283
- STL-10 10分類,輸入96963
- SVHN 街道路牌數字識別
- ILSVRC2012 task 1,1000個分類識別
2.目標識別
- Pascal VOC 2007 comp3
- Pascal VOC 2007 comp4
- Pascal VOC 2010 comp3
- Pascal VOC 2010 comp4
- Pascal VOC 2011 comp3
以上5個數據集,考察mAP(不同類別的AP的均值) - Caltech Pedestrians USA 加州理工行人檢測
- INRIA Person 法國國家信息與自動化研究所 人識別
- ETH Pedestrian蘇黎世聯邦理工學院 行人數據集
- TUD-Brussels Pedestrian 布魯塞爾都柏林大學行人數據集
- Daimler Pedestrian 戴勒姆行人數據
- KITTI Vision Benchmark 德國卡爾斯魯厄理工學院自動駕駛數據集
3.姿勢分析
- Leeds Sport Poses 利茲大學體育姿勢數據集
4語義標註
5.圖像分割
-Salient Object Detection benchmark 南開大學顯著性檢測算法