数据集:http://bigdata.51cto.com/art/201702/531276.htm
计算机视觉
MNIST: 最通用的健全检查。25x25 的数据集,中心化,B&W 手写数字。这是个容易的任务——但是在 MNIST 有效,不等同于其本身是有效的。
地址:http://pjreddie.com/projects/mnist-in-csv/
CIFAR 10 & CIFAR 100: 32x32 彩色图像。虽不再常用,但还是用了一次,可以是一项有趣的健全检查。
地址:https://www.cs.toronto.edu/~kriz/cifar.html
ImageNet: 新算法实际上的图像数据集。很多图片 API 公司从其 REST 接口获取标签,这些标签被怀疑与 ImageNet 的下一级 WordNet 的 1000 个范畴很接近。
LSUN: 场景理解具有很多辅助任务(房间布置评估、显著性预测等)和一个相关竞争。
地址:http://lsun.cs.princeton.edu/2016/
PASCAL VOC: 通用图像分割/分类:对于构建真实世界的图像注释毫无用处,对于基线则意义重大。
地址:http://host.robots.ox.ac.uk/pascal/VOC/
SVHN: 来自谷歌街景视图(Google Street View)的房屋数量。把这想象成荒野之中的周期性 MNIST。
地址:http://ufldl.stanford.edu/housenumbers/
MS COCO: 带有一个相关性竞争的通用图像理解/字幕。
Visual Genome: 非常详细的视觉知识库,并带有 100K 图像的深字幕。
Labeled Faces in the Wild:通过名称标识符,已经为被裁剪的面部区域(用 Viola-Jones)打了标签。现有人类的子集在数据集中有两个图像。对于这里做面部匹配系统训练的人来说,这很正常。
地址:http://vis-www.cs.umass.edu/lfw/
ImageNet的ILSVRC2012数据集