腾讯AI Lab参与：基于弹性网络正则化的深度神经网络对抗样本攻击

lwnylslwnyls

2018-01-30

腾讯 AI Lab 在 2018 年 AAAI 中入选论文 11 篇，其中一篇与 IBM Research、The Cooper Union 和加州大学戴维斯分校合作的论文入选口头报告（Oral）。这篇论文提出一种基于弹性网络正则化的攻击算法，该算法将对抗样本攻击 DNN 的过程形式化为弹性网络正则化的优化问题。此外，对基于 L1 失真攻击的评估为对抗式机器学习和 DNN 安全应用提供了全新的洞见，并进一步完善对抗式机器学习框架。

深度神经网络（DNN）在机器学习和人工智能的诸多不同任务（诸如图像分类、语音识别、机器翻译、打游戏）上取得了当前最优结果。尽管很有效，DNN 在对抗样本（Szegedy et al. 2013; Goodfellow, Shlens, and Szegedy 2015）面前依然表现的很脆弱。比如，一个精心设计的图像扰动可以轻易使训练良好的 DNN 失去分类能力。更糟糕的是，人类的感知实际上也无法在视觉上辨认有效对抗样本的区别。比如，图 1 给出了由我们的算法生成的鸵鸟图像的三个对抗样本，由一种当前最优的图像分类模型 Inception-v3（Szegedy et al. 2016）分别识别为「安全」、「鞋店」和「吸尘器」。

腾讯AI Lab参与：基于弹性网络正则化的深度神经网络对抗样本攻击

图 1：由 EAD（算法 1）生成的对抗样本。原始样本是一张来自 ImageNet 数据集（图 1 (a)）的鸵鸟图像。图 1 (b) 中的对抗样本被 Inception-v3 识别为不同的类别标签。

DNN 在对抗样本面前所欠缺鲁棒性引起了安全类应用的强烈关注，包括交通信号识别、恶意软件检测等等。然而，在数字空间之外的现实世界，研究者已表明对抗样本在愚弄 DNNs 上依然有效（Kurakin, Goodfellow, and Bengio 2016a; Evtimov et al. 2017）。鉴于鲁棒性和安全性的存在，制作对抗样本的方法称作 DNN 攻击。特别是，有目标的攻击旨在制造被误分类为特定目标类别的对抗样本，而无目标的攻击旨在制作不是原始分类的对抗样本。迁移攻击旨在制作可从一个 DNN 模型迁移到另一个的对抗样本。除了评估 DNN 的鲁棒性，对抗样本还可用于训练能够适应对抗扰动的鲁棒模型，这称之为对抗训练（Madry et al. 2017），并已经用于解释 DNN（Koh and Liang 2017; Dong et al. 2017）。

在整篇论文中，我们使用对抗样本攻击基于深度卷积神经网络的图像分类器。制作有效对抗样本的原理在于操控预测结果，同时又保证与原始图像的相似性。具体来讲，在文献中原始与对抗样本之间的相似性已经进行了不同的失真度量（distortion metrics）。一个常用的失真度量是 L_q 范数，其中

腾讯AI Lab参与：基于弹性网络正则化的深度神经网络对抗样本攻击

上式表示任意 q ≥ 1 的 p 维向量 x = [x_1, . . . , x_p] 的 L_q 范数。尤其当制作对抗样本时， L∞失真度量用于评估最大的像素值变化（Goodfellow, Shlens, and Szegedy 2015），而 L2 失真度量则用于提升视觉质量（Carlini and Wagner 2017b）。

然而，尽管 L1 范数广泛用于图像降噪、还原（Fu et al. 2006）以及稀疏恢复（Candes and Wakin 2008），基于 L1 的对抗样本并未被严格探讨。在对抗样本中，L1 失真说明了扰动中的总变化，并作为 L0 度量的凸替代函数，它可以度量扰动所修改的像素（即稀疏性）数量。为了弥补差距，我们提出了一种基于弹性网络正则化（Elastic-net regularization）的攻击算法，称为弹性网络正则化攻击（EAD）。弹性网络正则化是 L1 和 L2 惩罚函数的线性混合，已成为解决高维特征选择问题（Zou and Hastie 2005）的标准工具。在 DNN 攻击中，由于其推广了基于 L2 失真而提出的当前最优攻击方法（Carlini and Wagner 2017b），EAD 开辟了新的研究方向，并能够制造面向 L1 的对抗样本，它更有效，并迥然不同于现有的攻击方法。

为了探讨 EAD 基于 L1 构建的对抗样本效用，我们在不同的攻击情景中对 MNIST、CIFAR10 和 ImageNet 进行了大量实验。相较于当前最优的 L2 和 L∞攻击（Kurakin, Goodfellow, and Bengio 2016b; Carlini and Wagner 2017b），当攻击无防备和防备式提取的 DNN（Papernot et al. 2016b）时，EAD 可以获取相似的攻击成功率。更重要的是，我们发现 L1 攻击在迁移攻击中取得了优于 L2 和 L∞攻击的表现。对于更困难的数据集（MNIST），EAD 最终提升了从无防备 DNN 到防备式提取 DNN 的攻击迁移性，并取得了 99% 的攻击成功率。此外，带有 L1 和 L2 实例的联合对抗训练可以进一步提高 DNNs 对于对抗样本的适应力。这些结果表明 EAD 产生了一个截然不同，但更有效的对抗样本集。此外，对基于 L1 失真攻击的评估为对抗式机器学习和 DNN 安全应用提供了全新的洞见，并表明 L1 也许可以补充基于 L2 和 L∞的样本，进一步完善对抗式机器学习框架。

腾讯AI Lab参与：基于弹性网络正则化的深度神经网络对抗样本攻击

对比方法

我们对比了 EAD 和以下目标攻击，它们都是在不同失真度量中制造对抗样本的高效方法。

C&W 攻击：当前最优的 L2 目标攻击方法，由 Carlini 和 Wagner（Carlini and Wagner 2017b）提出。当β = 0 时，它是 EAD 算法的一个特殊案例。
FGM：快速梯度攻击算法（Goodfellow, Shlens, and Szegedy 2015）。在本文中我们使用 FGM-L1、FGM-L2 和 FGM-L∞表示不同的失真度量方法。
I-FGM：迭代的快速梯度攻击算法（Kurakin, Goodfellow, and Bengio 2016b）。在本文中我们使用 I-FGM-L1、I-FGM-L2 和 I-FGM-L∞表示不同的失真度量方法。

腾讯AI Lab参与：基于弹性网络正则化的深度神经网络对抗样本攻击

表 1: COV（change-of-variable）方法和 EAD（算法 1）在 MNIST 上实现弹性网络正则化攻击的对比。ASR 指攻击成功率 (%)。尽管这两个方法获得了相似的攻击成功率（皆接近或达到 100%），COV 在制作 L1 对抗样本上不甚有效。增加β减少了 EAD 的 L1-distorted 对抗样本，而 COV 的失真对β的变化却不敏感。

腾讯AI Lab参与：基于弹性网络正则化的深度神经网络对抗样本攻击

图 2：在带有不同 L1 正则化参数β（平均情况）的 MNIST 数据集上，EAD 中 EN 和 L1 决策规则的对比。相较于 EN 规则，对于相同的β，L1 规则获得了较少的失真，但也许会引发更多的 L2 和 L∞失真。

腾讯AI Lab参与：基于弹性网络正则化的深度神经网络对抗样本攻击

表 2：MNIST、CIFAR10 和 ImageNet（平均情况）上不同攻击的对比。失真度量取所有成功样本的平均值。EAD、C&W 攻击、I-FGM-L∞各自取得了最少的 L1、L2 和 L∞失真对抗样本。完整的攻击结果请参见附录资料 1。

腾讯AI Lab参与：基于弹性网络正则化的深度神经网络对抗样本攻击

图 3：在不同温度参数 T（防御性提取/defensive distillation）的 MNIST 和 CIFAR10 数据上，C&W 方法和 EAD 的攻击成功率（平均情况）。两种方法都可以攻克防御性提取。

腾讯AI Lab参与：基于弹性网络正则化的深度神经网络对抗样本攻击

图 4：κ不断变化的情况下，MNIST 数据集上从无防御网络到防御性提取网络的攻击迁移性（平均情况）。当κ = 50，EAD 取得了接近 99% 的攻击成功率，而当κ = 40，C&W 攻击的最高成功率是接近 88%。

腾讯AI Lab参与：基于弹性网络正则化的深度神经网络对抗样本攻击

表 3：在 MNIST 上使用 C&W 攻击和 EAD（L1 规则）的对抗训练。ASR 指攻击成功率。整合 L1 样本补充了对抗训练，并提升了失真方面的攻击难度。完整结果请参见附录材料 1。

论文：EAD: Elastic-Net Attacks to Deep Neural Networks via Adversarial Examples

腾讯AI Lab参与：基于弹性网络正则化的深度神经网络对抗样本攻击

论文地址：https://arxiv.org/pdf/1709.04114.pdf

近来的一些研究已经突出说明了深度神经网络（DNN）面对对抗样本时的脆弱性——人们可以轻松创造出在视觉上难以区分，却能让经过良好训练的模型分类错误的对抗图像。现有的对抗样本生成方法大多基于 L2 和 L∞ 范数去度量，但很少有方法用到了 L1 范数，尽管它有一些优良的性质，例如鼓励生成更为稀疏的对抗噪音。

在本论文中，我们将使用对抗样本攻击 DNN 的过程转化为了使用弹性网络正则化（elastic-net regularized）的优化问题。在这种表示下，当前最佳的 L2 范数攻击算法成为了本文方法的一个特例（在不考虑 L1 范数的情况下）。在 MNIST、CIFAR10 和 ImageNet 上的实验结果表明 EAD 算法可以生成具有很小 L1 失真的对抗样本，并且能在不同攻击场景中实现与当前最佳方法匹敌的攻击成功率。更重要的是，EAD 算法生成的对抗样本有着显著增强的攻击可迁移性，这为如何在对抗机器学习中使用 L1 范数失真以及增强 DNN 的安全性提供了全新的见解。

正则化深度神经网络 dnn lab

lwnylslwnyls

0 关注 0 粉丝 0 动态

相关推荐

数据科学面试中应了解的十种机器学习概念

如您本文转载自公众号“读芯术”。如您所知，数据科学和机器学习必须提供无穷无尽的信息和知识。话虽如此，大多数公司都只测试少数核心思想。这是因为这十个概念是更复杂的思想和概念的基础。您可能想知道为什么我什至不愿意将其放入，因为它是如此的基础。换句话说，更加重视

luyong0 2020-11-08

Python文本预处理，试试BAT大佬总结的实用代码！

本文将讨论文本预处理的基本步骤，旨在将文本信息从人类语言转换为机器可读格式以便用于后续处理。此外，本文还将进一步讨论文本预处理过程所需要的工具。当拿到一个文本后，首先从文本正则化处理开始。如果文本中的数字与文本分析无关的话，那就删除这些数字。通常，正则化

wordmhg 2020-11-06

Keras调用LSTM之函数接口介绍

activation: 要使用的激活函数，如果传入None，则不使用激活函数。默认分段线性近似 sigmoid 。use_bias: 布尔值，该层是否使用偏置向量。如果为 True，初始化时，将忘记门的偏置加 1。将其设置为 True 同时还会强制bi

xiaoxiaokeke 2020-07-28

机器学习---正则化

正则化的目的是为了防止过拟合，降低模型的复杂度。式中，是一个常数，为样本个数，是一个超参数，用于控制正则化程度。设置一个超参数 keep_prob，比如将 keep_prob 设置为 0.7，那么就会随机30%的节点消失，消失这个动作其实很简单，只是将这一

卖小孩的咖啡 2020-05-30

卷积神经网络模型可解释性

缺乏可解释性仍然是在许多应用中采用深层模型的一个关键障碍。在这项工作中，明确地调整了深层模型，这样人类用户可以在很短的时间内完成他们预测背后的过程。具体地说，训练了深度时间序列模型，使得类概率预测具有较高的精度，同时被节点较少的决策树紧密地建模。使用直观的

wenxuegeng 2020-05-04

机器学习基础---过拟合问题及正则化技术

到现在为止，我们已经学习了几种不同的学习算法，包括线性回归和逻辑回归，它们能够有效地解决许多问题，但是当将它们应用到某些特定的机器学习应用时，会遇到过拟合的问题，可能会导致它们效果很差。继续使用线性回归来预测房价的例子，我们通过建立以住房面积为自变量的函数

playoffs 2020-05-01

【Keras】减少过拟合的秘诀——Dropout正则化

阅读完本文，你就学会了在Keras框架中，如何将深度学习神经网络Dropout正则化添加到深度学习神经网络模型里。其原理非常简单粗暴：任意丢弃神经网络层中的输入，该层可以是数据样本中的输入变量或来自先前层的激活。它能够模拟具有大量不同网络结构的神经网络，并

CodeWang 2020-02-15

[深度之眼机器学习训练营第四期]过拟合与正则化

机器学习模型面临的两个主要问题是欠拟合与过拟合。而过拟合，即模型具有较高的方差，意味着模型的经验误差低而泛化误差高，对新数据的泛化能力差，如下右图所示。通常，欠拟合是由于模型过于简单或使用数据集的特征较少导致的。相反，过拟合则是模型过于复杂或特征过多引起的

kingzone 2020-01-23

神经网络中的过拟合

先说下一般对原始数据的划分为什么分为训练集、验证集、测试集三个部分？因为如果在test data上来调节参数，那么随着训练的进行，我们的网络实际上就是在一点一点地向我们的test data过度拟合，导致最后得到的testdata的指标参考意义下降。首先明确

georgesale 2020-01-01

如何理解深度学习中的dropout正则化技术解决过拟合问题？

正文为了解决神经网络的过拟合问题，我们需要使用L2正则化，除了L2正则化解决过拟合的问题，还可以使用另外一个正则化方法——Dropout，我们下面详细介绍一个这个正则化的原理。这个神经网络存在着过拟合的问题，我们要使用dropout来解决这个过拟合问题，d

无风而起 2019-12-24

避免神经网络过拟合的5种技术

本文介绍了5种在训练神经网络中避免过拟合的技术。最近一年我一直致力于深度学习领域。过拟合的模型通常是不精确的，因为这样的预测趋势并不会反映数据的真实情况。最常见的技术是L1和L2正则化：。L1惩罚项的目的是使权重绝对值最小化。然而L1不容易受到离群值的影响

雜貨鋪 2019-12-20

在深度学习中为什么正则化技术可以解决模型算法的过拟合问题？

正文如何解决过拟合问题？一种方式就是增加足够多的训练数据，另外一种方式就是使用正则化的方式，本节课程将讲解为什么正则化可以解决过拟合？为什么它可以减少高方差问题？上面的三张图中第一个是欠拟合（高偏差）。第二个是正常集合。那么此时我们为了解决这个神经网络的过

playoffs 2019-12-15

SIGAI机器学习第十八集线性模型2

之前讲过SVM，是通过最大化间隔导出的一套方法，现在从另外一个角度来定义SVM，来介绍整个线性SVM的家族。线性支持向量机简介L2正则化L1-loss SVC原问题L2正则化L2-loss SVC原问题L2正则化SVC对偶问题L1正则化L2-loss SV

sxyhetao 2019-12-03

改善深层神经网络（一）深度学习的实用层面

为什么正则化可以避免过拟合？当 lambda 足够大时，最小化 J 时，就会使得权重矩阵 w 趋近于0，神经网络简化为高偏差状态：。当 z 在较小的阶段，函数 g 趋近于线性. 如果每一层都趋近线性，该网络为线性网络，不会产生过拟合的情况.对于第3层进行随

PeterHuang0 2019-11-09

机器学习总结（算法）：回归、分类、正则化、模型优化、生成学习

在本文中，我们深入了解传统机器学习算法，包括回归、分类、核、高斯过程、贝叶斯线性回归、SVM、聚类和决策树，还包括成本函数，正则化，MLE, MAP，拉普拉斯近似和受限玻尔兹曼机，我们也将快速了解像LSTM这样的深度网络。线性回归模型y = f，线性向量为

stevenkwong 2019-09-20

单机多 GPU 加速 TensorFlow 程序

check 2019-10-31

机器学习-正则化（岭回归、lasso）和前向逐步回归

这个时候会出现矩阵不可逆的情况，为什么呢？遇到这种情况，我们可以采用正则化的方式或者剔除多余特征，这里我们介绍一些正则化的方式，例如岭回归、lasso，以及另外的一种方法：前向逐步回归。在数学，统计学和计算机科学中，尤其是在机器学习和逆问题中，正则化是添加

CYJ0go 2019-10-19

机器学习-正则化

目前为止我们已经学习了两种机器学习的方法了。如果你去实践，会发现很多问题，其中一项很可能就是过拟合的问题。过拟合就是我们在学习中，对样本的拟合非常好，但是一旦对新的样本就完全失效。这类问题以后还会有分析，究其原因，我们使用模型中某些特征的影响被放大了，这是

lizhengjava 2016-10-23

使用权重正则化较少模型过拟合

介绍权重正则化可以减轻深度神经网络模型的过拟合问题，可以提升对新数据的泛化能力。有多种正则方法可供选择，如：L1，L2正则化，每种方法在使用前需要超参数配置。在这篇文章中，你将学习在keras如何使用权重正则化的方法来减轻模型过拟合问题。

dataastron 2019-07-01

CVPR 2019：北邮提出新AI模型压缩算法，显著降低计算复杂度

来自北京邮电大学的研究人员开发了一种AI模型压缩算法，可以让深度学习的运算不再依赖高昂的计算和存储设备，保持模型的识别精度无损的前提下，显著降低模型的计算复杂度，本文带来技术解读。研究人员称，模型压缩算法能够有效降低参数冗余，从而减少存储占用、通信带宽和计

xgxyxs 2019-06-29

lwnylslwnyls

W3CSchool教程: HTML 教程; CSS 教程; Bootstrap 教程; Javascript 教程; jQuery 教程

后端教程: C 教程; Java 教程; PHP 教程; Python 教程; Go 教程

移动开发: Android 教程; Swift 教程; Kotlin 教程; jQuery Mobile 教程; ionic 教程

关于我们: 新闻动态; 联系方式; 招聘英才; 安科实验室; 帮助与反馈

安科网(Ancii)，中国第一极客网

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号京公网安备11010802014868号