神经网络水印IP 保护（Watermarking Deep Neural Networks with Greedy Residuals）

2023年7月13日下午7:57 • 人工智能 • 阅读 48

这篇看的时候挺早的，那会儿还是arxiv上，这篇发在ICML 2021，其实还是有很有意思的地方的。记录一下大概思路~

这篇整体的思路其实和最开始Uchida 的思路非常一致，主要目的一致，将水印插入在模型参数里面，但并不是随机选择参数，而是小部分更加”重要的”模型参数。

首先是在训练的时候加上一个惩罚项：

神经网络水印IP 保护（Watermarking Deep Neural Networks with Greedy Residuals）

\alpha 表示所有权信息， b是\alpha的大小，\omega 是以所有权信息为输入的符号函数（+，-），\lamda 是调整惩罚项大小的参数，\phi 就是所谓的residual information，其实也可以理解成藏在文章里面的水印。所以现在的关键就两点，一是个人信息，二是水印。

首先是个人信息，插入在\alpha里面，这篇文章的做法使用RSA编码，将一串msg（message）直接和私人密钥加密得到\alpha。

那么编码的符号就是：

这里sgn将1映射为1，0映射为-1。正常来讲RSA编码出来的应该是一串数字才对，他这里没有说，或者可以是将这串编码完的数字转化为二进制？在Uchida 的文章里面，也是根据正负号训练参数，这篇的做法类似，但是Uchida是根据参数原本的正负号，往两个边界训练参数，这里算是强行限定符号，以符号编码个人信息。

另一部分就是水印，水印其实做法也和Uchida的文章相似，但是前文说到，这里在一些更加重要的参数里面插入标记。所以首先要选出来在哪些参数上插入水印。首先，用以下方程将第l层的扁平化参数{\omega}^l，转化成 {\gamma} ^l（向量）。有点抽象，但是其实就是将扁平化参数 \omega 拆成了一段一段的，每一段相加并且乘以一个系数（k），这个系数几乎可以近似为这一段的长度（或者近似看成是求这一段的平均值）。

其中，函数k是：

这里面的两个类似中括号的东西分别是floor function 和 ceiling function，其实就是向下和向上取整函数。

这里的三个式子要注意一下维度，其中m 和d 分别是{\omega}^l 和 {\gamma} ^l 的维度。他这里后面说。m和d 谁大谁小可以任意，但是其实如果m \leq d 的话，\sigmma 就一直等于1，后面两个公式就没什么意义了，这时候相当于给向量\omega 加进去了一些0组成了\gamma。

得到{\gamma}^l 之后，由于\alpha 的大小是b，我们将 \gamma 变成 b b’ 的矩阵，在每一行都取出来绝对值最大的一部分元素（b’\eta（向下取整）个元素，\eta 后面可以选择，文中选了\eta=0.5，也就是百分之五十的元素）组成一个集合\mathcal{B}。最后将第i行组成集合里的元素取平均，就得到了greedy residual（当然在训练过程中这些数是会变的）：

文章在取这些集合\mathcal{B}的时候，因为训练么，所以绝对值最大的是在变化的，每一个batch可能都需要换参数。但是另一方面，文章里面的这个\phi也是有自己的符号的，正常来讲，他们应该同号，这样的话就会往绝对值大的地方跑，符号就是稳定的，但是这里并没有这点保证同号。有意思的是，这就会使得不同号的参数往0跑，同号的变大（也不一定是变大，看\mu的大小，我这里就当作\mu很大，不再细说这一边了）直到选出来同号的为止。也就是他这个算法其实会自然而然地限定选出来的参数的符号。

至于验证部分，首先我们检查模型里面是否存在水印，遵循上面的过程再来一遍就行了！如果有，那么可以用私钥检验一下所有权的归属。

水印里面的文章有不小一部分都涉及到了密码，但是大部分把密码学用在神经网络上的方法有个问题就是首先计算量大，其次不是很鲁棒，这篇文章第一点，由于用密码计算的部分比较少，看前面\alpha 是 256，所以计算量对于训练一个正常的神经网络来说是很小的。估计作者也意识到了，所以正文有一部分是在分析计算复杂度，虽然是针对参数提取部分（weight extraction），也就是后面\gamma这一部分。第二点就是不鲁棒，RSA算法还行，不像hash之类的微小改变会整个崩溃。
另一方面，这个方法实际上只在一层里面插入的水印，当然多插几层也不影响，只是收敛可能慢点。其实强行限定符号的行为确实会影响收敛速度，但应该也不是太影响，毕竟只有一层，而且解空间够大。

（ps：今天因为overleaf 崩溃了，所以写的文章，实验部分还没有细看，评价不好说，等看完实验再来补啦~其实这篇是之前一个知友推荐的，上次确实感觉理解的不够，所以这次想想还是把他放上来了。）

%————————————————————————————————————————
后面实验有些太好了，甚至让我有一点点疑惑。
前两天看到一篇yq团队的在LSTM上加了一个模式类似的水印，也是加在某一层里面。感觉这样的水印和直接在神经网络里面选出一层（比如线性层），人为的设定参数，调整保持这一层的参数整体满足一个特定分布 e.g. 正态分布（参数符号可以任意设置），参数期望和整体参数期望不偏离太大，基本上能做到类似的效果。相当于在中间加了一个简单线性映射。这样做对整体结果既没有影响，也不需要增加额外的训练，做到的效果跟这个类似。感觉这个方法乍一看起来高大上，但其实稍有点鸡肋。

Original: https://blog.csdn.net/weixin_44928295/article/details/126788309
Author: Miya
Title: 神经网络水印IP 保护（Watermarking Deep Neural Networks with Greedy Residuals）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/690513/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

2022-12-15 工作记录–React-用swiper实现多行交错、同速、跑马灯效果的弹幕式轮播（坑）

React -用 swiper 实现多行交错、同速、跑马灯效果的弹幕式轮播（坑）激动的心呀呀呀！٩(๑>◡ 【 React-用 swiper实现多行交错、同速、跑马灯效果的…

人工智能 2023年7月30日
0047
一种无需预先指定聚类个数的算法——Dbscan聚类算法

文章目录一、DBSCAN算法 * 1、介绍 – 1、算法介绍 2、算法原理 3、算法步骤 3、参数选择 4、Dbscan可视化 2、MATLAB实现一、DBSCAN…

人工智能 2023年6月2日
0058
《联邦学习实战》：从零开始通过联邦学习实现图像分类

《联邦学习实战》：从零开始通过联邦学习实现图像分类最近需要学习联邦学习，参考《联邦学习实战》入门，本文为《联邦学习实战》第三章的笔记。可算跑起来了，在重点分析代码之前，因为太…

人工智能 2023年7月6日
00101
基于类语言模型和令牌传递解码器的端到端上下文语音识别（论文翻译）

Title：END-TO-END CONTEXTUAL SPEECH RECOGNITION USING CLASS LANGUAGE MODELS AND A TOKEN PAS…

人工智能 2023年5月27日
0070
Python数据探索性分析和预处理

Python数据探索性分析和预处理讲在前面一.探索性分析 * 1.数据质量分析 – 1.缺失值 + 查看缺失情况缺失值处理 2.异常值 + 异常值检测（查看）异…

人工智能 2023年6月19日
0076
车道线检测论文Ultra-Fast-Lane-Detection-master代码复现过程

Ultra-Fast-Lane-Detection-master 摘要：现代的车道检测方法主要将车道检测视为像素分割问题，难以解决具有挑战性的场景和速度问题。受人类感知的启发，…

人工智能 2023年6月2日
0073
万物皆用MNIST—MNIST数据集及创建自己的手写数字数据集

刚刚接触到人工智能的我们，必定会遇到一个非常非常非常熟悉的朋友——MNIST这是一套流行的手写数字图片，常常被用来测试我们的思想和算法。这个数据集称为手写数…

人工智能 2023年6月15日
00158
Python判断一组数据是否服从正态分布

前言从文件中获取数据，判断数据是否服从正态分布或者近似服从正态分布。正态分布：也称”常态分布”，又名高斯分布（Gaussian distribution…

人工智能 2023年7月5日
0060
图数据库neo4j使用

零、预备备：启动数据库本机数据库版本 Neo4j 3.5.13以管理员身份运行控制台（win+A+X），在命令窗口切入到主目录%NEO4J_HOME%\bin执行neo4j.ba…

人工智能 2023年6月1日
0075
支持哪些常见的优化器

问题：哪些常见的优化器被支持？介绍在深度学习中，优化器是用来调整模型中可学习参数的算法。优化器的作用是通过最小化或最大化目标函数来使模型的性能达到最优。常见的优化算法有梯度下降…

人工智能 2023年12月31日
0022
python——linspace函数

def linspace(start, stop, num=50, endpoint=True, retstep=False, dtype=None, axis=0): &quot…

人工智能 2023年6月26日
0096
SAS基本统计分析语句

SAS基本统计分析语句 * – + 一、正态性检验(univariate) + 二、t检验(means univariate ttest) + 三、方差分析 + * 1…

人工智能 2023年6月27日
0069
图像分类（AlexNet）：代码笔记

文章目录（零）AlexNet前言知识 * 0.1 常用公式 0.2 深度学习的宏观框架 0.3 ImageNet数据集 AlexNet的历史意义 AlexNet完整结构图论文中…

人工智能 2023年7月1日
0092
【R语言】回归分析-斜率、截距与1和0的差异

setwd(“D:/试验数据/行为学/观察结果/”)library(“openxlsx”)a Original: https://b…

人工智能 2023年6月17日
0081
【论文阅读】【yolo系列】YOLOV7的论文阅读

4 Trainable bag-of-freebies 4.1. Planned re-parameterized convolution 尽管RepConv 在VGG 上取得了优…

人工智能 2023年6月25日
0072
工业相机和镜头的参数理解、选型、打光方案总结（附参考案例）

文章目录 * – 1.工业相机分类： – 2.工业相机相关参数： – 3.工业相机镜头相关参数 – ①焦距 – ②接圈 …

人工智能 2023年6月17日
0092

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

神经网络水印IP 保护（Watermarking Deep Neural Networks with Greedy Residuals）

大家都在看