MNIST
創建人:
Yann LeCun, Courant Institute, NYU
Corinna Cortes, Google Labs, New York
Christopher J.C. Burges, Microsoft Research, Redmond
類型:手寫數字數據庫,深度學習入門級經典數據集
數據量:60000,含10000條測試
網站:http://yann.lecun.com/exdb/mnist/
cifar10/cifar100
創建人:Alex Krizhevsky,Ilya Sutskever(Hinton的兩位弟子)
類型:普適物體識別的數據集
數據量:CIFAR-10數據集包含60000個32*32的彩色圖像,共有10類。有50000個訓練圖像和10000個測試圖像。CIFAR100則包括了100個類。
網站:http://www.cs.toronto.edu/~kriz/cifar.html
ImageNet
創建人:FeiFei Li
類型:目前世界上圖像識別最大的數據庫
數據量:千萬級
網站:http://www.image-net.org/
YouTube-8M
創建人:Google
類型:大型視頻數據集
數據量: 800 萬個 YouTube 視頻的 URL,代表 50 萬小時長度的視頻,並帶有視頻標註。這些標註來自一個多樣化的、包含了 4800 個知識圖譜實體(Knowledge Graph entity)的集合。
網站:https://research.google.com/youtube8m/explore.html
UCI數據集
創建人:加州大學歐文分校(University of California Irvine)
類型:提出的用於機器學習的數據庫
數據量:共有幾百個數據集,其數目還在不斷增加
網站:http://archive.ics.uci.edu/ml/