对抗攻击（Adversarial Attack）

2023年6月24日下午5:31 • 人工智能 • 阅读 82

文章目录

对抗攻击
对抗防御

对抗攻击

图片可以看成一个很长的向量，如果在图片的每个像素上都加上一个很小的pertubation(扰动、杂讯)，再把它输入到神经网络，这个时候分类器可能就会误判。
没有被攻击的图片一般称为Benign Image，被攻击的图片称为Attacked Image。
通常攻击可以分为定向攻击和非定向攻击：
定向攻击（targeted attack)：误分类成一个特定的类
非定向攻击(non-targeted attack)：误分类成其他类（只要不是cat类）

该如何去攻击？
假设benign image是x 0 x^0 x 0，输入到神经网络，输出y 0 = f ( x 0 ) y^0=f(x^0)y 0 =f (x 0 ) ，x 0 x^0 x 0的真实值是 y ^ \hat{y}y ^
被攻击后输入是x x x，输出y 0 = f ( x ) y^0=f(x)y 0 =f (x )；
想要攻击成功，就得让 y y y 和 y ^ \hat{y}y ^ 相差较大

这个问题的 loss函数是：
Non-targeted： L ( x ) = − e ( y , y ^ ) L(x)=- e(y,\hat{y})L (x )=−e (y ,y ^)
targeted：不仅需要 y y y 与 y ^ \hat{y}y ^ 越远越好，还要保证 y y y 与 y t a r g e t y^{target}y t a r g e t 越近越好
L ( x ) = − e ( y , y ^ ) + e ( y , y t a r g e t ) L(x)=- e(y,\hat{y})+e(y,y^{target})L (x )=−e (y ,y ^)+e (y ,y t a r g e t )
另外还期待加入的pertubation越小越好，这样就不容易被人类观察到(not perceived by humans)，即 x x x 和 x 0 x^0 x 0之间差距越小越好
所以完整的优化问题表达式是：
x ∗ = a r g min ⁡ d ( x 0 , x ) ≤ ϵ L ( x ) x^* = arg \min \limits_{d(x^0,x) \leq \epsilon} L(x)x ∗=a r g d (x 0 ,x )≤ϵmin L (x )
怎么计算d ( x 0 , x ) d(x^0,x)d (x 0 ,x )呢，这里采用的是 L-norm(范数)

L2-norm：d ( x 0 , x ) = ∣ ∣ Δ x ∣ ∣ 2 = ( Δ x 1 ) 2 + ( Δ x 2 ) 2 + ⋯ d(x^0,x)=||\Delta x||^2=(\Delta x_1)^2+(\Delta x_2)^2+\cdots d (x 0 ,x )=∣∣Δx ∣∣2 =(Δx 1 )2 +(Δx 2 )2 +⋯
L-infinity:d ( x 0 , x ) = ∣ ∣ Δ x ∣ ∣ ∞ = max ⁡ ( ∣ Δ x 1 ∣ , ∣ Δ x 2 ∣ , ⋯ ) d(x^0,x)=||\Delta x||_{\infty}=\max (|\Delta x_1|,|\Delta x_2|,\cdots)d (x 0 ,x )=∣∣Δx ∣∣∞=max (∣Δx 1 ∣,∣Δx 2 ∣,⋯)

与神经网络不同更新参数不同的是，对抗攻击是更新输入，同样也用梯度下降的方法，如下图所示：

首先可以从x 0 x^0 x 0开始，然后进行梯度下降，但是迭代过程中要注意限制，保证
d ( x 0 , x ) ≤ ϵ d(x^0,x) \leq \epsilon d (x 0 ,x )≤ϵ(以L-infinity为例，限制就是需要在以ϵ \epsilon ϵ为边长的正方形内)
可以看出，不同的攻击就是有不同的优化方法或者不同的限制。
几种著名的方法：

FGSM
论文链接：Explaining And Harnessing Adversarial Examples
论文笔记链接：
主要思路就是只需要一次迭代就可以达到攻击，另外在对loss求导外面加了一个符号函数sign（大于0输出1，小于0输出-1），这样确保了扰动的限制

I-FGSM
FGSM的升级版，即加入迭代版本，让攻击更准确
论文链接：Adversarial Examples In The Physical World
论文笔记链接：

白盒攻击&黑盒攻击

简单说就是白盒攻击知道模型的参数，黑盒攻击不知道模型的参数

黑盒攻击（black-box attack）

If you have the training data of the target network Train a proxy network yourself
Using the proxy network to generate attacked objects

黑盒攻击，不知道模型的参数，此时该怎么攻击？
如果知道目标网络的训练资料，可以训练一个替代模型，使用替代网络去产生被攻击的对象
那么黑盒攻击容易成功吗？
从论文（Delving into Transferable Adversarial Examples and Black-box Attacks）的实验来看，是容易成功的。
下图的表格，列代表被攻击的模型，行代表代理（proxy）模型。单元格（i，j）表示为模型 i（行）生成的对抗图像在模型 j（列）上评估的准确性。
对角线由于是同一模型，所以看成是白盒攻击。 不同行不同列即为黑盒，例如由ResNet-152生成的对抗样本在ResNet-101上的准确率仅为13%。准确率越低，表示攻击越成功。具体可以看这篇

另外还有很多黑盒攻击：

one-pixel attck
只需改变一个像素就可以达到攻击的目的
论文链接：One Pixel Attack for Fooling Deep Neural Networks
论文笔记链接：
Universal Attack Perturbation（UAP）
一个通用（与图像无关）和非常小的扰动向量，就可以让攻击成功（以往是针对不同的图像需要设计不同perturbation产生对抗样本）
论文链接：Universal adversarial perturbations
论文笔记链接：
BackDoor Attack（后门攻击）
攻击在训练阶段已经开始，对某张图片加了一些扰动，丢入神经网络进行训练

对抗攻击还被应用在 语音，自然语言处理等

; 对抗防御

1.主动防御
对抗训练

2.被动防御

加一个filter（滤波器）
图像压缩（先压缩再解压避开攻击）
Generator（按照对抗样本根据generator生成一张图片）
Randomization（随机的防御）

参考链接：
https://speech.ee.ntu.edu.tw/~hylee/ml/2022-spring.php

Original: https://blog.csdn.net/ji_meng/article/details/123931315
Author: nanyidev
Title: 对抗攻击（Adversarial Attack）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/649467/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

图像质量评估(9) — 杂散光（炫光，Flare，Glare）

当环境中存在强光源时（比如太阳或大功率灯光），强光源的光线到达镜头的时候，发生反射，反射光线到达不同的镜头部件、光圈或传感器上，会在图像中产生出光斑或光晕等非预期的图案，造成图像质…

人工智能 2023年6月20日
0078
机器人标定总结

1 引言工业机器人虽然重复定位精度很高，但由于绝对定位精度很低限制了工业机器人的应用，因此提高绝对定位精度能扩展工业机器人的应用范围。机器人可以将传感器安装在固定位置，具有固定的…

人工智能 2023年6月25日
0074
R语言Tukey检验进行事后检验（post hoc）实战：单因素方差分析告诉我们并不是所有的群体手段的效果是均等的，确切地找出哪些组彼此不同使用Tukey检验

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年5月30日
0076
使用 scikit-image 进行图像处理

点击上方” 小白学视觉“，选择加” 星标“或” 置顶“ 重磅干货，第一时间送达划痕试验时间序列分析。图像…

人工智能 2023年7月20日
0046
python3 pyqt5安装、配置及pyqt5 tools安装失败解决

目录一、pyqt5安装：二、配置三、各个个工具的功能一、pyqt5安装： pyqt5 tools安装失败解决：如果你是python3.10安装pyqt5，建议将python…

人工智能 2023年7月5日
0059
spss分析方法-聚类分析

聚类分析是根据研究对象的特征，按照一定标准对研究对象进行分类的一种分析方法。下面我们主要从下面四个方面来解说：实际应用理论思想建立模型 *分析结果一、实际应用聚类分析的目…

人工智能 2023年6月26日
0066
怎样用Python识别条形码？

最近一位热心的网友找到宋宋，想做一个条形码或者二维码的识别系统。现在，他在北京的某知名大型连锁超市，需要通过Python识别条形码，进行快速的商品库存录入。如果已经存在的则不进行…

人工智能 2023年7月19日
0050
SIFT算法详解

大纲引言一、高斯金字塔二、高斯差分金字塔三、特征点处理 * 1.阈值化 2.非极大值抑制 3. 二阶泰勒修正 4.低对比度去除 5.边缘效应去除四、特征点描述子 * 1….

人工智能 2023年7月6日
0084
[机器学习导论]——第二课——线性回归与逻辑回归

文章目录第二课——线性回归与逻辑回归 * 线性回归 – 梯度下降法求解 + 复习梯度梯度下降求解随机梯度下降法正规方程法求解三种求解方法的比较多项式回归模…

人工智能 2023年6月18日
0069
mysql 做回归模型_线性回归预测数据

读取数据，训练模型 load(file = “~/Downloads/df_bak.RData”) # 读取准备好的数据 bigModel library(…

人工智能 2023年6月18日
0075
数据分析 numpy、pandas、matplotlib

一、数据分析初始： 1.为什么要有数据分析？ a.岗位需求； b.python数据科学的基础； c.机器学习的基础； 2.数据分析：用适当的方法对收集的大量数据进行分析，帮助人们…

人工智能 2023年7月16日
0078
机器学习之聚类——从教授的等式到凸聚类

活动地址：CSDN21天学习挑战赛引子：大佬的等式在美国，有个牛逼的大学，叫华盛顿大学，其中有个牛逼的计算机科学教授，佩德罗·多明戈斯（Pedro Domingos），他…

人工智能 2023年6月3日
0072
分类——ID3算法

2、锻炼分析问题、解决问题并动手实践的能力。实验环境: Anaconda 1、数据集准备代码实现如下：年龄：0代表青年，1代表中年，2代表老年；收入：0代表低，1代表…

人工智能 2023年7月3日
0071
【Vue】Vue-Router 路由的理解和使用（2）

‍还有一个问题要给大家解答: 我们可以看到上面路由的配置里面，‍‍当访问根路径的时候直接就展示Home组件，而下面为什么会有一个import这样的语法，【第19行】实际上‍‍ …

人工智能 2023年6月30日
0088
机器学习之KNN算法（python代码实现）

kNN（k-Nearest Neighbors，k近邻）是机器学习中非常基础的一种算法，算法原理简单而且容易实现，结果精度高，无需估计参数，无需训练模型，而且不仅可以用于分类任务，…

人工智能 2023年6月23日
0063
100天精通Python（数据分析篇）——第53天：初始pandas模块

### 回答1：这个问题的意思是询问一个学习 Python 数据分析_的 _100 天_计划，我的回答如下： _Python 数据分析_是非常重要的技能之一，学习它需要长时间的实…

人工智能 2023年7月14日
0066

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

对抗攻击（Adversarial Attack）

文章目录

大家都在看