機器學習/深度學習數據集

MNIST

創建人:
Yann LeCun, Courant Institute, NYU
Corinna Cortes, Google Labs, New York
Christopher J.C. Burges, Microsoft Research, Redmond
類型:手寫數字數據庫,深度學習入門級經典數據集
數據量:60000,含10000條測試
網站:http://yann.lecun.com/exdb/mnist/

cifar10/cifar100

創建人:Alex Krizhevsky,Ilya Sutskever(Hinton的兩位弟子)
類型:普適物體識別的數據集
數據量:CIFAR-10數據集包含60000個32*32的彩色圖像,共有10類。有50000個訓練圖像和10000個測試圖像。CIFAR100則包括了100個類。
網站:http://www.cs.toronto.edu/~kriz/cifar.html

ImageNet

創建人:FeiFei Li
類型:目前世界上圖像識別最大的數據庫
數據量:千萬級
網站:http://www.image-net.org/

YouTube-8M

創建人:Google
類型:大型視頻數據集
數據量: 800 萬個 YouTube 視頻的 URL,代表 50 萬小時長度的視頻,並帶有視頻標註。這些標註來自一個多樣化的、包含了 4800 個知識圖譜實體(Knowledge Graph entity)的集合。
網站:https://research.google.com/youtube8m/explore.html

UCI數據集

創建人:加州大學歐文分校(University of California Irvine)
類型:提出的用於機器學習的數據庫
數據量:共有幾百個數據集,其數目還在不斷增加
網站:http://archive.ics.uci.edu/ml/

其他數據集彙總

http://dmr.cs.umn.edu/datasets.html

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章