計算機視覺標準數據集整理

http://www.cnblogs.com/zhao441354231/p/6140217.html

https://pjreddie.com/projects/pascal-voc-dataset-mirror/

VOC2007 與 VOC2012

此數據集可以用於圖像分類,目標檢測,圖像分割!!!

數據集下載鏡像網站: http://pjreddie.com/projects/pascal-voc-dataset-mirror/

VOC2012: Train/Validation Data(1.9GB),Test Data(1.8GB),主頁: http://host.robots.ox.ac.uk:8080/pascal/VOC/voc2012/

VOC2007: Train/Validation Data(439MB),Test Data(431MB),主頁: http://host.robots.ox.ac.uk:8080/pascal/VOC/voc2007/

MNIST手寫體數據集(用作10類圖像分類)

包含了60,000張28x28的二值(手寫數字的)訓練圖像,10,000張28x28的二值(手寫數字的)測試圖像.用作分類任務,可以分成0-9這10個類別!

引用:Y. LeCun, L. Bottou, Y. Bengio, and P. Haffner. "Gradient-based learning applied to document recognition." Proceedings of the IEEE, 86(11):2278-2324, November 1998.

CIFAR-10(用作10類圖像分類)

此數據集包含了60,000張32x32的RGB圖像,總共有10類圖像,大約6000張圖像/類,50,000張做訓練,10,000張做測試!

此數據集有三個版本的數據可供下載: Python版本(163MB), MATLAB版本(175MB), 二值版本(162MB)!

CIFAR-100(用作100類圖像分類)

這個數據集和CIFAR-10相比,它具有100個類,大約600張/類,每類500張訓練,500張測試.這100類又可以grouped成20個大類.

此數據集也有三個版本的數據可供下載: Python版本(161MB), MATLAB版本(175MB), 二值版本(161MB)!

引用: Learning Multiple Layers of Features from Tiny Images, Alex Krizhevsky, 2009

CIFAR-10和CIFAR-100都是80 million tiny images dataset的子集!

80 million tiny images dataset

這個數據集包含了79,302,017張32x32的RGB圖像,下載時包含了5個文件,網站上也提供了示例代碼教你如何加載這些數據!

1. Image binary (227GB)

2. Metadata binary (57GB)

3. Gist binary (114GB)

4. Index data (7MB)

5. Matlab Tiny Images toolbox (150kB)

Caltech_101(用作101類圖像分類)

這個數據集包含了101類的圖像,每類大約有40~800張圖像,大部分是50張/類,在2003年由lifeifei收集,每張圖像的大小大約是300x200.

數據集下載: 101_ObjectCategories.tar.gz(131MB)

Caltech_256(用作256類圖像分類)

此數據集和Caltech_101相似,包含了30,607張圖像,數據集下載: 256_ObjectCategroies.tar(1.2GB)

Imagenet

IMAGENET Large Scale Visual Recognition Challenge(ILSVRC)

從2010年開始,每年舉辦的ILSVRC圖像分類和目標檢測大賽,數據集下載: http://image-net.org/download-images


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章