更优的ImageNet模型可迁移性更强？谷歌大脑论文给出验证

KEVINLONG

2018-06-26

选自arXiv

作者：Simon Kornblith、Jonathon Shlens、Quoc V. Le

机器之心编译

参与：Geek AI、张倩

现代计算机视觉研究的一个隐含的假设是，在 ImageNet 上性能更好的模型必定在其它的视觉任务上表现得更好。然而，这个假说从来没有被系统地验证过。谷歌大脑研究者在 3 组实验环境下对比了 13 个分类模型在 12 个图像分类任务上的性能。实验结果表明，ImageNet 架构在其它数据集上的泛化能力很强，在 ImageNet 数据集上的精确率的小小的提升就能够导致在其它数据集上性能的提升，但是 ImageNet 提取出的固定特征的泛化能力小于其架构的泛化能力。

过去十年来，计算机视觉研究一直将追赶学术上用于对比的基准模型的性能作为衡量进步的标准。然而没有任何一个基准能像 ImageNet [1] 一样被如此激烈地追赶。针对这一数据集构建的网络架构，在许多方面显著促进了计算机视觉研究的进步，包括将模型迁移到新的数据集 [2，3]、目标检测 [4]、图像分割 [5，6] 和图像质量评价 [7]。这一进展背后一个隐含的假设是，在 ImageNet 上性能更好的网络架构必定在其它视觉任务上表现得更好。另一个假设是，更好的网络架构能够学到更好的能在基于视觉的任务之间迁移的特征。尽管之前的研究已经为这些假说提供了一些证据（例如，[4，5，8-10]），但是这些假说还没有被系统地探究过。

在本文中，研究者试图通过研究 ImageNet 特征和 ImageNet 分类架构的可迁移性来检验这些假说。具体而言，研究者在 12 个图像分类数据集上对 13 个性能最好的图像分类卷积神经网络间的迁移学习进行了大规模的研究，实验环境如图 1 所示，包含以下三种类型：固定的特征提取器 [2，3]，从 ImageNet 的初始化 [8，11，12] 环境中进行调优，从随机初始化开始训练。本文的主要贡献如下：

最佳的 ImageNet 模型没有给出最佳的图像特征。在 ImageNet 上训练的 ResNet 模型 [14，15] 的特征始终优于那些在 ImageNet 上取得更高准确率的网络。
当网络经过调优后，ImageNet 的准确率是迁移任务准确率的更强有力的指标（r^2 = 0.86），目前最先进的 ImageNet 架构在许多任务中取得了最佳性能。
即使权重信息并不能在任务间很好地迁移，但是网络架构可以很好地被迁移。在 3 个小型细粒度分类数据集上，调优并不能为从随机初始化状态开始的训练提供显著的帮助，但是尽管如此，更好的 ImageNet 架构能取得更高的准确率。

更优的ImageNet模型可迁移性更强？谷歌大脑论文给出验证

图 1: 细粒度数据集（FGVC 飞机）上的性能可以从调优或从头开始的训练中获得很大的提升，和 ImageNet 类似的数据集（CIFAR-10）上的提升则小一些。低维嵌入在从「inception v4」网络的倒数第二层中的特征上使用 t-SNE[13]，用于测试集中的 10 个类别。

更优的ImageNet模型可迁移性更强？谷歌大脑论文给出验证

表 1: 在迁移学习中被检验的数据集。

更优的ImageNet模型可迁移性更强？谷歌大脑论文给出验证

图 2: 在 ImageNet 上取得的准确率对于迁移到其它数据集上的经过了调优的模型有很大的预测作用。每组图片都测量了使用固定的 ImageNet 特征（最上面的一组）、经过调优的网络（中间的一组）、以及随机初始化的网络（最下方的一组）在 ImageNet 上的准确率和迁移任务的准确率之间的相关性。左图：不同的训练环境下，在迁移数据集上的分类准确率（y 轴）和最佳的 ImageNet 模型的准确率（x 轴）之间的关系。右图：相对于数据集上所有分类器的平均值，在数据集上正确分类的平均对数几率。误差条表示标准差。与最佳模型没有显出差异（p>0.05）的模型对应的点为绿色。

更优的ImageNet模型可迁移性更强？谷歌大脑论文给出验证

图 3: 对网络进行调优在固定的 ImageNet 特征上或从随机初始化模型开始的训练得到的特征取得了比 logistic 回归更高的准确率。在固定的 ImageNet 特征上的 Logistic 回归和从随机初始化开始训练的网络的性能在很大程度上取决于数据集。图中的坐标经过了合理的放缩。

更优的ImageNet模型可迁移性更强？谷歌大脑论文给出验证

图 4: 对 ImageNet 调优取得了目前最好的性能。数据条表示 logistic 回归、参数调优以及从随机初始化开始训练的模型（不包括 VGG）准确率。误差条表示标准差。数据点代表独立的模型。黑色水平线代表之前最好的模型性能。

更优的ImageNet模型可迁移性更强？谷歌大脑论文给出验证

表 2: 最优模型的性能。

更优的ImageNet模型可迁移性更强？谷歌大脑论文给出验证

图 5: 在 ImageNet 上预训练的网络收敛得更快。每个点表示一个使用优化过的超参数训练的 inception v4 模型。图中的坐标轴被合理放缩过。

更优的ImageNet模型可迁移性更强？谷歌大脑论文给出验证

图 6: 在 ImageNet 上预训练能够提升拥有小规模数据的细粒度任务的性能。在不同规模数据集上的 Inception v4 模型的性能。误差条反映了 3 个子集的标准差。请注意，图中显示的最大数据集的大小并不是整个数据集的大小。

论文：Do Better ImageNet Models Transfer Better?

更优的ImageNet模型可迁移性更强？谷歌大脑论文给出验证

论文链接：https://arxiv.org/pdf/1805.08974.pdf

摘要：随着 ImageNet 中提取出的特征的出现，迁移学习已经成为了计算机视觉的基石。然而评估 ImageNet 架构在不同数据集上的表现的研究却很少。现代计算机视觉研究的一个隐含的假设是，在 ImageNet 上性能更好的模型必定在其它的视觉任务上表现得更好。然而，这个假说从来没有被系统地验证过。在本文中，研究者在 3 组实验环境（固定的特征提取器、经过调优的网络权重、从随机初始化开始训练）下对比了 13 个分类模型在 12 个图像分类任务上的性能。研究者发现，当网络直接被用作固定的特征提取器时，在 ImageNet 上的准确率对它在其它网络上准确率的预测能力很弱（r^2=0.24）。在这种情况下，ResNet 的迁移能力始终优于那些在 ImageNet 上取得更高的准确率的网络。当网络经过调优后，研究者观察到一个显著增强的 ImageNet 的准确率和迁移任务的准确率之间的相关性（r^2=0.86）。研究者通过对目前最先进的 ImageNet 架构进行调优在 8 个图像分类任务上取得了目前最好的模型性能，超越了之前基于专门的迁移学习方法得到的结果。最后，研究者观察到，在 3 个小型细粒度图像分类数据集上，从随机初始化开始训练而来的网络和用 ImageNet 预训练的网络的性能相似。总而言之，本文的实验结果表明，ImageNet 架构在其它数据集上的泛化能力很强，在 ImageNet 数据集上的精确率的小小的提升就能够导致在其它数据集上性能的提升，但是 ImageNet 提取出的固定特征的泛化能力小于其架构的泛化能力。

谷歌 imagenet 架构

KEVINLONG

0 关注 0 粉丝 0 动态

相关推荐

开发者指南：5个2020年软件开发趋势预测

企业上云已成不可逆的趋势，全面云计算时代宣告来临，微服务已成软件架构主流，免代码开发将会变得更酷，2020 年还有哪些技术趋势值得观察？对于云厂商来说，2019 年是硕果累累的一年。谷歌趋势表明，微服务架构范式在 2019 年持续增长了一整年。不过，Fli

草原孤狼 2020-08-19

谷歌正在测试一个人工智能系统，帮助视障人士参加跑步比赛

本文转自雷锋网，如需转载请至雷锋网官网申请授权。谷歌正在测试一种人工智能系统，帮助盲人和有视力障碍的人自行参加比赛。Project Guideline是一项早期研究计划，试图给予这些人更多的独立性。据VentureBeat报道，为了使用该系统，跑步者需要将

人工智能快报 2020-11-21

谷歌概述了2021年的Android应用开发与政策变动规划

谷歌刚刚在 Android 开发者博客中披露了 2021 年的开发计划，比如 8 ~ 11 月的时候，所有新应用都必须支持 Android 11 的 API Level 30 。此外 Google Play 将要求新提交的 App 使用 Android A

xfcyhades 2020-11-20

全面解读谷歌云人工智能如何为机器学习提供帮助

谷歌公司拥有行业规模最大的机器学习堆栈之一，目前以其Google Cloud AI和机器学习平台为中心。谷歌公司在数年前就开源了TensorFlow，但TensorFlow仍然是一个最成熟的、并且广泛引用的深度学习框架。同样，谷歌公司几年前将Kubern

Pokemogo 2020-11-16

Python之父，现在成为微软打工人

Python之父，现在成了微软的打工人。没错，全世界程序员们最喜欢的编程语言的创造者，自述耐不住退休生活的寂寞，重返岗位发光发热。又为什么选择微软？几个小时前，Guido Van Rossum本人发推宣布了这个消息，他说：「退休生活太无聊了，我决定加入微软

guangcheng 2020-11-13

微软和谷歌分别开源分布式深度学习框架，各自厉害在哪？

微软和谷歌一直在积极研究用于训练深度神经网络的新框架，并且在最近将各自的成果开源——微软的PipeDream和谷歌的GPipe。原则上看，他们都遵循了类似的原则来训练深度学习模型。这两个项目已在各自的研究论文中进行了详细介绍，这篇文章将对此进行总结。对于初

深圳克林斯曼 2020-11-09

研究员准备让智能设备用AI来判断你的声音来自哪里

虽然这个想法让隐私保护主义者感到害怕，但智能音箱的开发者们正在努力让他们的设备在没有听到用户唤醒词的情况下也能启动。我们知道谷歌已经在研究这项技术，但现在，卡内基梅隆大学那边的人也在跟进，研究人员已经开发出了一种机器学习模型，利用人工智能的力量精确判断某人

机器之心 2020-11-06

17款Android App被强制删除，Google Play商店发现恶意软件已感染数百万设备

本周谷歌从官方Play Store删除了17款Android应用程序。据来自Zscaler的安全研究人员Viral Gandhi称，这17个应用程序全部感染了Joker恶意软件。据调查发现，这批病毒软件从3月份开始活跃，已经成功感染了数百万台设备。今年1

Urchindong 2020-11-04

华为谈安卓：无惧谷歌技术中断，鸿蒙系统下月登陆手机

11月3日消息，之前外界一直担心，如果谷歌突然收紧安卓系统，对于华为来说，可能又是一次重要的打击，不过现在外界多虑了，而华为消费者业务软件部总裁王成录也是透露了一些内幕情况。王成录透露，从去年516之后，华为基本上跟Google中断了技术交流，但是华为今年

Michael 2020-11-03

苹果正秘密开发自家搜索功能谷歌地位会被取代吗？

最新版的iPhone操作系统iOS 14出现了一个不太显眼的变化，苹果开始显示自己的搜索结果，并在用户从主屏幕键入信息查询时直接链接到网站。多位业内人士表示，这种网络搜索功能的出现标志着苹果内部开发的一个重要进展，可能会对谷歌搜索发起更全面的竞争奠定基础。

章鱼之家 2020-10-29

封了TikTok，印度又要动谷歌？

6月29日以来，印度政府共封禁过近两百款中国应用，出海印度一时风声鹤唳。同时，美国巨头包括Facebook和谷歌在印度烧钱烧得手软，一起向电信运营商Jio砸下100多亿美金。10月初，印度移动支付巨头Paytm联合数十家初创企业准备起诉谷歌。虽然，目前两款

fengyeezju 2020-10-14

危险信号：谷歌AI把戴口罩的女性识别为被胶带封嘴的女人

根据FuninUSA报道，微软、谷歌和IBM的视觉系统要跟上现实世界需要做很多工作。这项研究的一些结果确实令人不安。市场营销公司Wunderman Thompson的数据集团进行了这项研究，研究了著名的视觉AI对戴PPE口罩的男性和女性的观察方式是否相同。

hanfuquan0 2020-10-12

谷歌、脸书、亚马逊……这10大科技巨头都在使用Python

十年前，由于编程语言种类匮乏，开发人员不必苦恼自己应该选择哪一种编程语言;但是现在，世界上正在使用的编程语言超过500种，随着人们的不断交流，还会有更多的语言出现。对于开发人员而言，基于项目的特点等因素确定应该使用哪一种编程语言成为了首要任务。Python

89347543 2020-10-10

美最高法院将对甲骨文诉谷歌Android代码案作出终审裁定

甲骨文与谷歌就 Android 代码问题发起的诉讼，距今已有将近 10 个年头。经历了三次审判和两次上诉，这场官司终于还是闹上了美国最高法院。期间两家科技巨头已经动用了无数的人力和诉讼费用，以及努力向非技术专业的陪审团成员解释其中的缘由。不过当地时间周三上

韩伟佳 2020-10-09

前谷歌机器人主管打造出能够灵活延伸的辅助机器人

据悉，延伸研究版目前的售价为17950美元。

幸福左手边 2020-10-09

现在知道还不算晚，输入示例自动生成代码，谷歌开源这项神器要火

操作张量并非易事，因为它需要很多先决条件，例如跟踪多个维度，Dtype兼容性，数学正确性和张量形状等。当然最大的挑战还是从数百种可用选项中确定正确的TensorFlow操作。如果会的话，谷歌的TensorFlow Coder可以帮你实现这一点。然后，它会运

lybbb 2020-09-29

谷歌为Chronicle网络安全平台引入威胁检测功能

VentureBeat 报道称，谷歌已正式将威胁检测功能引入该公司旗下的 Chronicle 网络安全平台，并承诺为企业提供与自家规模相当的威胁分析服务。作为最初诞生于 Alphabet 内部 X 部门的一个项目，其于 2018 年成为了一家独立的网络

关于学习本身 2020-09-24

谷歌推出 Go 版 Android 11，适用于入门级设备

Android 11刚刚发布，谷歌的Go 版本 Android 11也紧随其后。Android Go 版本最初于 2018 年推出，旨在为入门级设备提供智能手机体验。今年七月，曾有泄露的谷歌文档显示“谷歌提高 Android RAM 要求，低于 2GB 将

Angelia 2020-09-11

鸿蒙距离安卓还有多远？

“我们已经开始构建自己的生态，把生态干起来，鸿蒙 OS 系统已经投入上亿，体验一直在改善，现在能达到安卓 70%-80% 的水平，但是每天每周每个月都在改进。”近期，华为消费者业务 CEO 余承东谈论了鸿蒙 OS 目前的状态。就在前一天，DigTimes

刘炳昭 2020-09-10

谷歌保持技术竞争力的秘诀：以全球规模工程为先

本文内容，源自我在谷歌提供软件工程师这六年当中的亲身实践，以及对谷歌内部广泛工程运营活动的观察。希望通过这篇文章，能够对谷歌的全球规模工程实施做出一番宏观概述。从 2013 年 8 月到 2019 年 4 月的这六年时间，我有幸加入谷歌参与一系列项目。谷歌

tft0 2020-09-09

KEVINLONG

W3CSchool教程: HTML 教程; CSS 教程; Bootstrap 教程; Javascript 教程; jQuery 教程

后端教程: C 教程; Java 教程; PHP 教程; Python 教程; Go 教程

移动开发: Android 教程; Swift 教程; Kotlin 教程; jQuery Mobile 教程; ionic 教程

关于我们: 新闻动态; 联系方式; 招聘英才; 安科实验室; 帮助与反馈

安科网(Ancii)，中国第一极客网

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号京公网安备11010802014868号