【机器学习】李宏毅——Adversarial Attack（对抗攻击）

2023年10月11日下午2:50 • Python • 阅读 87

研究这个方向的动机，是因为在将神经网络模型应用于实际场景时，它仅仅拥有较高的正确率是不够的，例如在异常检测中、垃圾邮件分类等等场景，那些负类样本也会想尽办法来”欺骗”模型，使模型无法辨别出它为负类。因此我们希望我们的模型能够拥有应对这种攻击的能力。

How to Attack

通过影像辨识的例子来解释如何进行攻击。

假设我们已经训练了一个图像的分类器，对于我们下图中输入的图片它能够分辨出来是一只猫；那么我们现在对原始的输入进行一定的扰动，加入干扰项再输入到模型中看看它是否会辨别成其中的东西（图中这种扰动太大了，一般加入的扰动项是人眼无法辨别的）：

那么这种攻击又划分为两类：

Non-targeted：这一类的攻击只要求能够让模型无法辨认出来是猫就行
targeted：这一类的模型是有目的性的，除了让模型无法辨别出来是猫之外，还希望让模型辨别出来是特定的物品

这里有一个很神奇的现象，假设我们加入的杂讯比较大，我们人眼能够直接观察得到：

可以发现机器还是大部分能够发现这是一只猫，只不过可能品种不同而已。但如果加入的杂讯是我们特别准备的，并且肉眼看不出来的：

可以看到 不仅分类错误了，连信心分数都激增，并且事实上 我们可以调整我们的杂讯让机器把这张看起来像一只猫的图片分辨成任何东西，因此这也是我们需要机器能够对抗攻击的原因之一。

那么接下来我们就来认识一下是怎么做到这种攻击的。

对于我们当前拥有的分类器，输入一张猫的图片(x^0)它输出为一个向量，是每一个类别的信心分数，其中最高的为猫。

对于无目标的攻击来说，我们在原始图像更换成一张图片(x) ，它也经过分类器的处理后输出一个向量，那希望是这个向量能够和猫这个类别对应的One-hat-vector之间的距离越远越好
对于有目标的攻击来说， *我们在原始图像更换成一张图片(x) ，它也经过分类器的处理后输出一个向量，那不仅希望是这个向量能够和猫这个类别对应的One-hat-vector之间的距离越远越好，还希望这个向量与目标类别的One-hat-vector之间的差距越小越好

而对于向量之间的差距我们可以用交叉熵来表示，因此得到：

那么对于无目标的攻击，可以设定其损失函数为：

[L(x)=-e(y,\hat{y}) ]

对于有目标的攻击可以设定其损失函数为：

[L(x)=-e(y,\hat{y})+e(y,y^{target}) ]

因此优化目标为：

[x^*=argmin_{d(x^0,x)

Original: https://www.cnblogs.com/FavoriteStar/p/17000101.html
Author: FavoriteStar
Title: 【机器学习】李宏毅——Adversarial Attack（对抗攻击）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/796187/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

关于numpy中的一维行向量、列向量的理解

许久以来都有一个疑问，numpy中的一维向量究竟是行向量还是列向量呢？今天得空，测试一下。思路思路很简单，利用点乘两个向量维度要对应的特性测试。 1.创建一个4*2矩阵a和一…

Python 2023年8月24日
0084
python | 使用flask部署celery异步服务并用flower实时查看——初级代码教程

文章目录 0. 安装redis、celery、flower * 0.1 安装redis 0.2 安装celery和flower 1. celery+flask代码结构及代码内容 *…

Python 2023年8月11日
0052
pandas 入门之index，代码均在python3.7环境调试过，也有注释，部分有运行结果，比较大的结果集未列出

import numpy as np import pandas as pd 传入一个列表 S1 = pd.Series(["a", "b"…

Python 2023年8月8日
0075
用Python模拟识别图片验证码并发送手机验证码

Original: https://www.cnblogs.com/123456feng/p/16067659.htmlAuthor: 蚂蚁ailingTitle: 用Python…

Python 2023年11月9日
0027
如何使用Postman调试HMS Core推送接口？

HMS Core 推送服务支持开发者使用HTTPS协议接入Push服务端。Postman是一款接口测试工具，它可以模拟用户发起的各类HTTP请求，将请求数据发送至服务端，获取对应的…

Python 2023年10月23日
0035
python数据可视化之matplotlib.pyplot绘图时图片显示不全的解决方法(图文并茂版！！！)

解决方法 * – 问题分析 – 问题分析 – 问题解决 – + 方法解释 – 上述报错解决代码问题分析 •有时在我们使…

Python 2023年8月31日
0060
python pygame小游戏_python：利用pygame实现消消乐小游戏

消消乐记分小游戏GUI界面文件结构规划定义config.py文件存储相关参数：包括界面的宽高，整个方格行列个数，总格数等等。定义utils.py文件用于存放基础的类和函数：包…

Python 2023年9月21日
0031
《Python程序设计与算法基础教程（第二版）》江红余青松课后选择题课后填空题答案

第一章 Python语言属于 C A.机器语言 B.汇编语言 C.高级语言 D.以上都不是在下列选项中，不属于Python特点的是 B C.可移植性 D.免费和开源 A.面向对象…

Python 2023年9月26日
0036
python list和series转换dataframe_Pandas把dataframe或series转换成list的方法

把dataframe转换为list 输入多维dataframe： df = pd.DataFrame({‘a’:[1,3,5,7,4,5,6,4,7,8,9…

Python 2023年8月19日
0049
django实现点赞功能

我这里只接收了需要点赞的文章id这个参数，至于如何判断该请求是点赞还是取消赞，则是从对应文章的users_like中查询，如果已有记录，说明点过赞，那就进行取消赞操作，如果没有记…

Python 2023年10月30日
0046
python数据分析之pandas数据预处理（数据合并与数据提取、loc、iloc、ix函数详解）

文章目录一、准备工作二、数据合并 1、merge数据表连接 2、添加数据三、数据提取 1、索引列 2、loc函数（⭐）…

Python 2023年5月24日
0055
【Pygame小游戏】Chrome上的小恐龙竟可以用代码玩儿了？它看起来很好玩儿的样子~

前言 🚀 作者：”程序员梨子”🚀 文章简介：本篇文章主要是写了使用 Pygame模块写的小恐龙游戏的小代码啦~🚀 文章源码免费获取：为了感谢每一个关…

Python 2023年9月18日
0045
pandas取列号_从Pandas条件获取行和列号

我想得到基于给定条件的行和列号。”坐标”如果你愿意的话。在import re import pandas as pd import numpy as np …

Python 2023年8月8日
0065
FR+Django实现报表导入DBF数据

FR+Django实现报表导入DBF数据 DBF格式文件是一种类似于excel的行列式存储且支持sql查询的数据文件，其广泛的应用于事业单位中的数据交换目前FR不支持DBF格式文件…

Python 2023年8月4日
0052
[pandas] DataFrame自定义排序

工作中经常遇到需要根据某一个变量进行自定义排序，例如要排序长度字段 [“0-12″,”12-30″,”30-60″,”60-120″,”120-180″,”180-240”,”24…

Python 2023年8月7日
0072
pandas模块的基本使用

numpy能够帮助我们处理数值，但是pandas除了能处理数值之外(基于numpy)，还能够帮助我们处理其他类型的数据pandas技术文档：https://pandas.pydat…

Python 2023年8月22日
0043

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

【机器学习】李宏毅——Adversarial Attack（对抗攻击）

How to Attack

大家都在看