lmageNet 数据集简介
ImageNet数据集是一个计算机视觉数据集,是由斯坦福大学的李飞飞教授带领创建。该数据集包合 14,197,122张图片和21,841个Synset索引。 Synset是WordNet层次结构中的一个节点,它又是 一组同义词集合。 ImageNet数据集一直是评估图像分类算法性能的基准。
ImageNet 数据集是为了促进计算机图像识别技术的发展而设立的一个大型图像数据集。2016 年ImageNet 数据集中已经超过干万张图片,每一张图片都被手工标定好类别。ImageNet 数据集中的图片涵盖了大部分生活中会看到的图片类别。ImageNet最初是拥有超过100万张图像的数据集。如图下图所示,它包含了各种各样的图像,并且每张图像都被关联了标签(类别名)。每年都会举办使用这个巨大数据集的ILSVRC图像识别大赛。
ImageNet是一个按照WordNet层次结构(目前只有名词)组织的图像数据库,其中层次结构的每个节点都由成百上千个图像来描述。目前,我们平均每个节点有500多个图像。
1、ImageNet数据集的意义
- ImageNet拥有用于分类、定位和检测任务评估的数据。
- 与分类数据类似,定位任务有1000个类别。准确率是根据最高五项检测结果计算出来的。
- 所有图像中至少有一个边框。对200个目标的检测问题有470000个图像,平均每个图像有1.1个目标。
2、ImageNet的数据结构——层次结构及其1000个类别
3、ImageNet数据集与ILSVRC竞赛的关系、
ILSVRC使用ImageNet的一个子集,总共有大约120万个训练图像,50,000个验证图像,以及150,000个测试图像;1000类别标记。
Large Scale Visual Recognition Challenge 即ILSVRC(2012~2017)比赛,是基于该数据集的1000个类别的比赛。训练集120万张图片。 从2010年起, 每年ImageNet 的项目组织都会举办一场基于ImageNet 的大规模视觉识别竞赛( lmageNet Large Scale VisualRecognition Challenge , ILSVRC ) 。在ILSVRC 竞赛中诞生了许多成功的图像识别方法,其中很多是深度学习方法, 它们在赛后又会得到进一步发展与应用。
可以说, ImageNet 数据集和ILSVRC 竞赛大大促进了计算机视觉技术, 乃至深度学习的发展, 在深度学习的浪潮中占有举足轻重的地位。
4、与CIFAR-10数据集比较
相比CIFAR-10 , ImageNet 数据集图片数量更多, 分辨率更高,含有的类别更多(高上干个图像类别),图片中含高更多的无关噪声和变化,因此识别难度比CIFAR-10 高得多。
5、数据集下载
具体下载方式参见知乎:ImageNet数据集下载与处理 - 知乎 (zhihu.com)