人體姿態:
LSP (2D)
地址:http://sam.johnson.io/research/lsp.html
樣本數:2K
關節點個數:14
全身,單人
FLIC (2D)
地址:https://bensapp.github.io/flic-dataset.html
樣本數:2W
關節點個數:9
全身,單人
MPII (2D)
地址:http://human-pose.mpi-inf.mpg.de/
樣本數:25K
關節點個數:16
全身,單人/多人,40K people,410 human activities
MSCOCO (2D)
地址:http://cocodataset.org/#download
樣本數:>= 30W
關節點個數:18
全身,多人,keypoints on 10W people
Human3.6M: http://vision.imar.ro/human3.6m/description.php
MPI-INF-3DHP:http://gvv.mpi-inf.mpg.de/3dhp-dataset/
圖像:
minist: http://yann.lecun.com/exdb/mnist/
MNIST是最受歡迎的深度學習數據集之一,這是一個手寫數字數據集,包含一組60,000個示例的訓練集和一個包含10,000個示例的測試集。這是一個很好的數據庫,用於在實際數據中嘗試學習技術和深度識別模式,同時可以在數據預處理中花費最少的時間和精力
ImageNet: http://www.image-net.org/
ImageNet是根據WordNet層次結構組織的圖像數據集。WordNet包含大約100,000個單詞,ImageNet平均提供了大約1000個圖像來說明每個單詞。
open images: https://github.com/openimages/dataset
該數據集是一個包含近900萬個圖像URL的數據集,這些圖像跨越了數千個類的圖像級標籤邊框並且進行了註釋。該數據集包含9,011,219張圖像的訓練集,41,260張圖像的驗證集以及125,436張圖像的測試集。
CIFAR-10: https://www.cs.toronto.edu/~kriz/cifar.html
該數據集是圖像分類的另一個數據集,它由10個類的60,000個圖像組成(每個類在上面的圖像中表示爲一行)。總共 有50,000個訓練圖像和10,000個測試圖像。數據集分爲6個部分:5個訓練批次和1個測試批次,每批有10,000個圖像。
NLP:
visual QA:http://visualqa.org/
人民日報1998詞性標註數據集:https://pan.baidu.com/s/1r-MinHBWs36spZyi_LSLbQ 提取碼:8546
references:
[1] https://blog.csdn.net/qq_36165459/article/details/78332172
[2] https://segmentfault.com/a/1190000014230303
[3] paper: human mesh recovering