发布时间:2024-09-11 16:01
ImageNet官网:http://image-net.org/
ImageNet由斯坦福李飞飞教授带领创建,ImageNet本身有2万多个的类别,超过1400万张图片,其中超过100万张图片有明确类别标注和物体位置标注。
适用任务:图像分类,目标检测,目标定位、视频目标检测、场景分类
特别解释:ILSVRC (ImageNet Large-Scale Visual Recognition Challenge) 是一个基于 ImageNet 的比赛,每年都会从ImageNet中抽取部分数据作为比赛数据集。ILSVRC 从 2010 年开始举行,每年一次,到 2017 年最后一届结束,因此 “ILSVRC+年份” 也用来特指某一年比赛的数据集(属于ImageNet的子集),基于 ILSVRC 比赛的子数据集也是各种论文中最常用的数据集。
很多论文都常用 ILSVRC2012 作为实验数据集,ILSVRC2012 包含1000个类别,每个类别大约有1000张图片。注意测试集未公开标注信息,因此常用验证集来进行模型的测试。
ILSVRC2012 | 类别数 (Number of classes) | 图片数 (Number of images) | 文件大小 (Size on disk) | 标注 |
---|---|---|---|---|
训练集 | 1000类 | 约120万张图片 | ~140GB | 公开 |
验证集 | 1000类 | 5万张图片 | ~6GB | 公开 |
测试集 | 1000类 | 10万张图片 | ~13GB | 未公开 |
在官网下载ILSVRC2012时,可以看到训练数据集(Training images)被分为了 (Task1 & 2) 和 (Task 3),其中 (Task 1 & 2) 是用于图像识别任务的,
验证集(Validation images)对应的标注信息在Development kit (Task 1 & 2)
中,下载压缩包后解压,找到ILSVRC2012_devkit_t12/data
文件夹,里面的ILSVRC2012_validation_ground_truth.txt
就是验证集对应的标注label。
ImageNet不可用于商业目的,因此需要认证edu邮箱,直接用学校邮箱认证的话请求会立马通过,如果用其他后缀的普通邮箱需要审核1~5天还不一定能审核通过。用学校邮箱认证之后会收到邮件,从邮件内提供的链接就可以进入数据的Download
页面,ILSVRC下面按照年份分类,一般最常用的就是ILSVRC 2012,可以根据自己的需要选择年份。进入之后在Images
条目下就是Train/Val/Test数据。
step1:进入Download页面 - 按需选择ILSVRC年份:
step2:在Images
部分就是训练/验证/测试数据集
关于下载方式,如果不方便从官网下载,可以选择以下备用方案:
麒麟操作系统 (kylinos) 从入门到精通 - 系统设置 - 第二十二篇 关闭系统自动更新解决关机或重启被阻止的问题
Visual Studio中C++部分的官方文档链接【微软(Microsoft)所有产品的官方文档链接】
Python、C、C++ 和 C# 中有望诞生 TIOBE 2022 年度编程语言!
Electron搭配React的history路由模式打包exe客户端
【HTML CSS JS 蝴蝶飞舞特效 绝美(附完整代码)】
vue项目中解决eslint与prettier同时使用时校验冲突问题
MyBatis教程[1]----项目构建并完成第一个查询操作