数据集(持续更新)

这篇文章主要收集网上的一些数据集,记录下来,方便查阅。

  1. MNIST:手写数字数据库;
  2. Imagenet:1400多万幅图片,涵盖2万多个类别;
  3. COCO:由微软赞助,对于图像的标注信息不仅有类别、位置信息,还有对图像的语义文本描述;
  4. PASCAL VOC:图片集包括20个目录;
  5. CIFAR:对图像分类算法测试来说是一个非常不错的中小规模数据集;
  6. Open Image:包含900万张图像URL的数据集,里面的图片通过标签注释被分为6000多类;
  7. Youtube-8M:谷歌开源的视频数据集,视频来自youtube,共计8百万个视频,总时长50万小时,4800类;
  8. 深度学习数据集收集网站:收集大量的各深度学习相关的数据集;
  9. Tiny Images Dataset:包含8000万的32x32图像,CIFAR-10和CIFAR-100便是从中挑选的;
  10. CoPhIR:雅虎发布的超大Flickr数据集,包含1亿多张图片;
  11. MirFlickr1M:Flickr数据集中挑选出的100万图像集;
  12. SBU captioned photo dataset:Flickr的一个子集,包含100万的图像集;
  13. NUS-WIDE:Flickr中的27万的图像集;
  14. Large-Scale Image Annotation using Visual Synset(ICCV 2011):机器标注的一个超大规模数据集,包含2亿图像;
  15. SUN dataset:包含13万的图像的数据集;
  16. MSRA-MM:包含100万的图像,23000视频;微软亚洲研究院出品,质量应该有保障;
  17. 农业、生物、数据竞赛、教育、金融、健康汇总
  18. 人脸识别数据集
  19. Yahoo实验室公开1亿Flickr图像和视频
  20. 比较新的一个计算机视觉数据库网站
  21. KONECT 网络图结构和网络科学数据合辑
  22. 【Kaggle竞赛】人脸关键点标定竞赛数据
  23. 【Kaggle竞赛】根据手机应用软件使用行为预测用户性别年龄竞赛数据
  24. 【Kaggle竞赛】DSTL 卫星图像识别竞赛数据
  25. 【Kaggle竞赛】猫和狗图像分类数据
  26. 【Kaggle竞赛】根据安检人体扫描成像预测威胁竞赛
  27. 【Kaggle竞赛】泰坦尼克灾难数据
  28. 【Kaggle竞赛】费城犯罪记录数据
  29. 【Kaggle竞赛】广告实时竞价数据
  30. 【Kaggle竞赛】新闻和网页内容推荐及点击竞赛
  31. 【Kaggle数据】IMDB五千部电影数据
  32. 【Kaagle数据】欧洲足球运动员赛事表现数据
  33. 【Kaagle数据】世界各国经济发展数据
  34. Social Computing Data Repository 社交网络数据
  35. 国际地面交换站日间数据
  36. MIT Saliency 眼睛浏览轨迹数据集
  37. 聊天机器人语料
  38. 英语语言模型单词预测竞赛数据
  39. ALOV++ 物体追踪视频数据
  40. NIST Supplemental Fingerprint Card Data (SFCD) 指纹识别数据
  41. Human Pose Evaluator 人体轮廓识别图像数据
  42. 1万本畅销书的6百万读者评分数据
  43. Visual Genome 图像及语义数据集
  44. CBCL StreetScenes Challenge 场景数据
  45. Winton 股票回报率预测竞赛数据
  46. Capital 共享单车骑行数据
  47. Caltech数据集

参考链接1

您的支持将鼓励我努力创作!