3
8
11
新手上路
原文链接:ImageNet Classification with Deep Convolutional Neural Networks
ImageNet是一个由超过1500万张标注的高分辨率图像组成的数据集,属于大约22,000个类别。这些图像是从网上收集的,并由人类贴标者使用亚马逊的研究工具众包工具进行标记。从2010年开始,作为Pascal视觉对象挑战赛的一部分,每年举办一次名为ImageNet大规模视觉识别挑战赛( ILSVRC )的竞赛。ILSVRC使用ImageNet的一个子集,在1000个类别中的每个类别中大约有1000个图像。总共有大约120万张训练图像、50,000张验证图像和150,000张测试图像。 ILSVRC-2010是唯一一个测试集标签可用的ILSVRC版本,因此这是我们进行大部分实验的版本。由于我们也在ILSVRC-2012竞赛中输入了我们的模型,在第6节中我们也报告了我们在这个版本的数据集上的结果,对于这个版本的数据集,测试集标签是不可用的。在ImageNet上,通常报告两个错误率:top-1和top-5,其中top-5错误率是模型认为最可能的5个标签中没有正确标签的测试图像的分数。 ImageNet由可变分辨率的图像组成,而我们的系统需要一个恒定的输入维度。因此,我们将图像降采样到256×256的固定分辨率。给定一个矩形图像,我们首先对图像进行缩放,使较短的边长为256,然后从结果图像中裁剪出中心的256×256块。我们没有以任何其他方式预处理图像,除了从每个像素中减去训练集的平均活动。因此,我们在像素的(中心)原始RGB值上训练我们的网络。
使用道具 举报
本版积分规则 发表回复 回帖后跳转到最后一页
Archiver手机版
Powered by Discuz! X3.4© 2001-2015 Comsenz Inc.