ImageNet数据集 & 下载

发布时间:2024-09-11 16:01

文章目录

  • 数据集说明
  • 数据集下载方式

数据集说明

ImageNet官网:http://image-net.org/

ImageNet由斯坦福李飞飞教授带领创建,ImageNet本身有2万多个的类别,超过1400万张图片,其中超过100万张图片有明确类别标注和物体位置标注。

适用任务:图像分类,目标检测,目标定位、视频目标检测、场景分类

特别解释ILSVRC (ImageNet Large-Scale Visual Recognition Challenge) 是一个基于 ImageNet 的比赛,每年都会从ImageNet中抽取部分数据作为比赛数据集。ILSVRC 从 2010 年开始举行,每年一次,到 2017 年最后一届结束,因此 “ILSVRC+年份” 也用来特指某一年比赛的数据集(属于ImageNet的子集),基于 ILSVRC 比赛的子数据集也是各种论文中最常用的数据集。

很多论文都常用 ILSVRC2012 作为实验数据集,ILSVRC2012 包含1000个类别,每个类别大约有1000张图片。注意测试集未公开标注信息,因此常用验证集来进行模型的测试。

ILSVRC2012 类别数 (Number of classes) 图片数 (Number of images) 文件大小 (Size on disk) 标注
训练集 1000类 约120万张图片 ~140GB 公开
验证集 1000类 5万张图片 ~6GB 公开
测试集 1000类 10万张图片 ~13GB 未公开

在官网下载ILSVRC2012时,可以看到训练数据集(Training images)被分为了 (Task1 & 2) 和 (Task 3),其中 (Task 1 & 2) 是用于图像识别任务的,
ImageNet数据集 & 下载_第1张图片
验证集(Validation images)对应的标注信息在Development kit (Task 1 & 2)中,下载压缩包后解压,找到ILSVRC2012_devkit_t12/data文件夹,里面的ILSVRC2012_validation_ground_truth.txt就是验证集对应的标注label。
ImageNet数据集 & 下载_第2张图片

数据集下载方式

ImageNet不可用于商业目的,因此需要认证edu邮箱,直接用学校邮箱认证的话请求会立马通过,如果用其他后缀的普通邮箱需要审核1~5天还不一定能审核通过。用学校邮箱认证之后会收到邮件,从邮件内提供的链接就可以进入数据的Download页面,ILSVRC下面按照年份分类,一般最常用的就是ILSVRC 2012,可以根据自己的需要选择年份。进入之后在Images条目下就是Train/Val/Test数据。

step1:进入Download页面 - 按需选择ILSVRC年份:
ImageNet数据集 & 下载_第3张图片
step2:在Images部分就是训练/验证/测试数据集
ImageNet数据集 & 下载_第4张图片

关于下载方式,如果不方便从官网下载,可以选择以下备用方案:

  • 方式1:https://hyper.ai/datasets/4889
  • 方式2:迅雷种子下载,提取码 x7jn
  • 方式3:ImageNet LSVRC 2012 Training Set (Object Detection)

ItVuer - 免责声明 - 关于我们 - 联系我们

本网站信息来源于互联网,如有侵权请联系:561261067@qq.com

桂ICP备16001015号