DC-CDN学习笔记

2023年7月12日上午4:17 • 人工智能 • 阅读 87

论文题目：Dual-Cross Central Difference Network for Face Anti-Spoofing

论文地址：https://arxiv.org/pdf/2105.01290.pdf

代码地址：GitHub – ZitongYu/CDCN: Central Difference Convolutional Networks (CVPR’20)

研究意义

人脸识别技术以其便捷性和准确性在许多交互式智能系统中得到广泛应用。然而，人脸识别系统仍然容易受到包括打印、视频和 3D mask 在内的演示攻击 (PA)。因此，学术界和工业界都认识到人脸反欺骗（FAS）对于保护人脸识别系统的关键作用。

FAS 任务中的一个关键挑战是如何使用有限的数据来学习特征表示，因为现有的 FAS 数据集由于欺骗生成和视频记录的高收集成本而没有大量的训练数据。虽然通用的数据增强方式能够扩大数据集的规模和多样性，但它仍然没有对性能提升做出太大贡献。因此，值得重新思考 FAS 的增强和设计任务专用的增强范式。

本文主要贡献

（1）设计了一个称为交叉中心差分卷积 (C-CDC) 的稀疏卷积算子，它将 CDC 分别解耦为两个交叉（即水平/垂直 (HV) 和对角线 (DG)）方向的卷积，用于挖掘相互关系和增强局部细节表示，且计算成本也降低了。

（2）提出了 FAS 专用的数据增强方法 Patch Exchanges (PE)，用于合成具有不同攻击和域的混合样本，它能够在 DC-CDN 和现有 FAS 方法中即插即用。

CDC

引入了中心梯度特征来增强表示和提升泛化能力，可表示为：

其中，R 为感受野区域，

为感受野区域内各像素点相对于中心像素点的偏移量，如 (−1, −1),(−1, 0), · · · ,(0, 1),(1, 1)。

其中，

用来平衡标准卷积与 CDC 提供信息的比例。

C-CDC

从上式可以发现，CDC 聚合了整个局部相邻区域 R 的标准特征和中心梯度特征，这可能是冗余且难以优化的。作者因此提出了稀疏跨中心差分卷积 (C-CDC) 系列，旨在学习更集中和内在的特征表示。与 CDC 相比，C-CDC 倾向于在局部区域内进行稀疏采样，公式如下：

具体来说，作者将 R 解耦为两个交叉相邻区域 (HV 与 DG)，其中，

= {(−1, 0),(0, −1),(0, 0),(0, 1),(1, 0)}，

= {(−1, −1),(−1, 1),(0, 0),(1, −1),(1, 1)}。此外，这种解耦方式有利于模型收敛和获取鲁棒特征表示。

代码如下：

（1）C-CDC(HV)

class Conv2d_Hori_Veri_Cross(nn.Module):
    def __init__(self, in_channels, out_channels, kernel_size=3, stride=1,
                 padding=1, dilation=1, groups=1, bias=False, theta=0.7):

        super(Conv2d_Hori_Veri_Cross, self).__init__()
        self.conv = nn.Conv2d(in_channels, out_channels, kernel_size=(1, 5), stride=stride, padding=padding, dilation=dilation, groups=groups, bias=bias)
        self.theta = theta

    def forward(self, x):

        [C_out,C_in,H_k,W_k] = self.conv.weight.shape
        tensor_zeros = torch.FloatTensor(C_out, C_in, 1).fill_(0).cuda()
        conv_weight = torch.cat((tensor_zeros, self.conv.weight[:,:,:,0], tensor_zeros, self.conv.weight[:,:,:,1], self.conv.weight[:,:,:,2], self.conv.weight[:,:,:,3], tensor_zeros, self.conv.weight[:,:,:,4], tensor_zeros), 2)
        conv_weight = conv_weight.contiguous().view(C_out, C_in, 3, 3)

        out_normal = F.conv2d(input=x, weight=conv_weight, bias=self.conv.bias, stride=self.conv.stride, padding=self.conv.padding)

        if math.fabs(self.theta - 0.0) < 1e-8:
            return out_normal
        else:
            [C_out,C_in, kernel_size,kernel_size] = self.conv.weight.shape
            kernel_diff = self.conv.weight.sum(2).sum(2)
            kernel_diff = kernel_diff[:, :, None, None]
            out_diff = F.conv2d(input=x, weight=kernel_diff, bias=self.conv.bias, stride=self.conv.stride, padding=0, groups=self.conv.groups)

            return out_normal - self.theta * out_diff

（2）C-CDC(DG)

class Conv2d_Diag_Cross(nn.Module):
    def __init__(self, in_channels, out_channels, kernel_size=3, stride=1,
                 padding=1, dilation=1, groups=1, bias=False, theta=0.7):

        super(Conv2d_Diag_Cross, self).__init__()
        self.conv = nn.Conv2d(in_channels, out_channels, kernel_size=(1, 5), stride=stride, padding=padding, dilation=dilation, groups=groups, bias=bias)
        self.theta = theta

    def forward(self, x):

        [C_out,C_in,H_k,W_k] = self.conv.weight.shape
        tensor_zeros = torch.FloatTensor(C_out, C_in, 1).fill_(0).cuda()
        conv_weight = torch.cat((self.conv.weight[:,:,:,0], tensor_zeros, self.conv.weight[:,:,:,1], tensor_zeros, self.conv.weight[:,:,:,2], tensor_zeros, self.conv.weight[:,:,:,3], tensor_zeros, self.conv.weight[:,:,:,4]), 2)
        conv_weight = conv_weight.contiguous().view(C_out, C_in, 3, 3)

        out_normal = F.conv2d(input=x, weight=conv_weight, bias=self.conv.bias, stride=self.conv.stride, padding=self.conv.padding)

        if math.fabs(self.theta - 0.0) < 1e-8:
            return out_normal
        else:
            [C_out,C_in, kernel_size,kernel_size] = self.conv.weight.shape
            kernel_diff = self.conv.weight.sum(2).sum(2)
            kernel_diff = kernel_diff[:, :, None, None]
            out_diff = F.conv2d(input=x, weight=kernel_diff, bias=self.conv.bias, stride=self.conv.stride, padding=0, groups=self.conv.groups)

            return out_normal - self.theta * out_diff

DC-CDN

基于伪深度图的监督利用真假人脸的 3D 形状来进行区分，该监督方式能够提供逐像素的详细线索来强制 FAS 模型捕获内在特征。给定大小为 3256256 的单张 RGB 人脸图像，提取多级融合特征用于预测大小为 32*32 的人脸深度图。 C-CDN的详细信息如下表：

尽管 C-CDC 解耦并学习具有特定视图的局部梯度特征，但与 CDC 相比，它仍然存在信息丢失的问题。为了充分利用局部特征并在 HV 和 DG 视图之间进行交互，提出了一种双交叉中心差分网络 (DC-CDN)，如下图所示。

CFIM

为了有效挖掘双流（HV与DG）之间的关系并增强局部详细表示能力，提出了交叉特征交互模块（CFIM）自适应地融合双流多级特征，公式如下：

其中，

为sigmoid激活函数；

、

都是可学习的参数，分别表示对应

与

的注意力权值，在训练迭代期间自适应调整。部分代码如下：

self.HP_branch1 = Parameter(torch.zeros([3,1]))
self.HP_branch2 = Parameter(torch.zeros([3,1]))

fusion1
x_Block1_new = F.sigmoid(self.HP_branch1[0])*x_Block1 + (1-F.sigmoid(self.HP_branch1[0]))*x_Block1_2
x_Block1_2_new = F.sigmoid(self.HP_branch2[0])*x_Block1_2 + (1-F.sigmoid(self.HP_branch2[0]))*x_Block1

fusion2
x_Block2_new = F.sigmoid(self.HP_branch1[1])*x_Block2 + (1-F.sigmoid(self.HP_branch1[1]))*x_Block2_2
x_Block2_2_new = F.sigmoid(self.HP_branch2[1])*x_Block2_2 + (1-F.sigmoid(self.HP_branch2[1]))*x_Block2

fusion3
x_Block3_new = F.sigmoid(self.HP_branch1[2])*x_Block3 + (1-F.sigmoid(self.HP_branch1[2]))*x_Block3_2
x_Block3_2_new = F.sigmoid(self.HP_branch2[2])*x_Block3_2 + (1-F.sigmoid(self.HP_branch2[2]))*x_Block3

由于欺骗攻击收集成本高，公共 FAS 数据集的数据大小和多样性有限。因此作者还提出了一种名为 Patch Exchanges (PE) 的 FAS 专用数据增强方法，用于合成具有不同攻击和域的混合样本。 PE 增强有三个优点：(1）引入来自不同领域（例如，记录的场景、传感器和主题）的人脸 patch，以丰富数据分布；(2) 随机补丁交换以模拟任意形式攻击；(3）具有相应密集标签的交换补丁将强制模型学习更详细和内在的特征以进行欺骗检测。伪代码如下：

损失函数

L = 均方误差 (MSE) + 对比深度损失 (CDL)

实验

下表为 OULU-NPU 数据集上的实验结果：

下表为 SiW-M 数据集上的实验结果：

下表为CASIA-MFSD 和 Replay-Attack 之间的跨数据集测试结果：

结论

作者提出了两个跨中心差分卷积（C-CDC，基于这两个解耦的C-CDC，建立了一个强大的双交叉中心差分网络（DC-CDN）和交叉特征交互模块（CFIM），用于相互关系挖掘和局部细节表示增强。此外，通过简单地从随机样本中交换面部补丁及其密集标签，提出了一种新的 FAS 补丁交换 (PE) 增强策略，这有利于内在和鲁棒的特征学习。

Original: https://blog.csdn.net/qq_38964360/article/details/125902462
Author: Cassiel_cx
Title: DC-CDN学习笔记

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/686912/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

LeetCode链表练习（中）

文章目录前言 1.剑指 Offer 25. 合并两个排序的链表 * 1.题目分析 2.代码示例 2.回文链表 * 1.题目分析 2.代码示例 3.剑指 Offer 52. 两个链…

人工智能 2023年6月27日
00114
两天时间，用Python重写了我的Markdown-Online系统，主要使用了Flask技术栈的基础知识，这不比游戏有意思？

Markdown-Online 文末附源码之前写的《在线Markdown编辑系统》本来只是自己瞎搞的，没想到用起来真香~~ 而且，还有很多童鞋对之前的叙利亚战损版系统非常感兴趣，…

人工智能 2023年7月5日
00107
Pytorch基础知识（15）基于PyTorch的多标签图像分类

早在 2012 年，神经网络就首次赢得了 ImageNet 大规模视觉识别挑战。Alex Krizhevsky，Ilya Sutskever 和 Geoffrey Hinton 彻…

人工智能 2023年6月25日
0053
Pytorch实现线性回归模型

利用Pytorch实现线性回归模型主要步骤为：（1）定义数据集，这里需要注意在Pytorch中使用的是mini-batch那么因此数据集是矩阵形式（2）自定义模型类，在定义模型类的…

人工智能 2023年6月16日
0074
【滤波专题-第4篇】滤波器滤波效果的评价指标（信噪比SNR、均方误差MSE、波形相似参数NCC）

之前两篇文章讲了滤波算法的两大最基本理论FIR和IIR。本篇将讲一下滤波效果的评价指标与用法。评价指标主要用于对滤波效果的量化评价，在论文里经常会用到。一、信噪比SNR 信噪比（…

人工智能 2023年7月27日
0055
机器学习【期末复习总结】——知识点和算法例题（详细整理）

机器学习【期末复习总结】——知识点和算法例题（详细整理） 1、什么是机器学习，什么是训练集，验证集和测试集？（摘自 ML科普系列（一））机器学习：对计算机一部分数据进行学习，…

人工智能 2023年6月15日
00240
百度api语音识别

百度API进行音频识别（包括长音频） api注册短音频识别长音频识别音频格式转换项目地址参考网页 api注册首先进度百度智能云，之后在里面注册一个语音识别api,获得密…

人工智能 2023年5月27日
0081
pip._vendor.urllib3.exceptions.ReadTimeoutError: HTTPSConnectionPool(host=files.pythonhosted.org解决方案

大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多…

人工智能 2023年7月27日
0049
Numpy中数据的常用的保存与读取方法

1.numpy.save 保存一个数组到一个二进制的文件中,保存格式是 .npy 参数介绍numpy.save(file, arr, allow_pickle=True, fix_…

人工智能 2023年7月6日
0087
免费试用Kaggle的GPU,进行深度学习，每周可以使用41小时GPU和20小时TPU

进入官网：Kaggle: Your Home for Data Science 然后注册一个账号，创建一个Notebook 设置为GPU Adding a free GPU You…

人工智能 2023年7月28日
0064
基于Django+Vue开发的社区疫情管理系统（附源码）

基于Django、Django Rest framework、Vue的前后端分离的社区疫情管理系统。用户管理（只有管理员有权限）用户注册用户登录修改用户信息删除用户修改…

人工智能 2023年7月30日
0069
录音喊话器的故障修理_警用喊话器哪里买？

产品功能：功能：扩音、240秒录音、放音、警报、哨音、照明、MP3(支持U盘和TF卡)、电量显示。产品参数： • 工作电压：9.6-12V • 充电时间：3-4小时 • 充电器…

人工智能 2023年5月27日
00256
隐藏通知内容什么意思_原来华为手机隐藏5个技巧，难怪别人都说华为好用，涨知识了…

原来华为手机隐藏5个技巧，难怪别人都说华为好用，涨知识了！我们身边的很多朋友已经开始陆续换成华为手机了，所以今天我们就来说说为什么用过华为手机的人都说好用，并整理了6个贴心贴心的…

人工智能 2023年5月27日
00197
EEG | EEGNet 神经网络分类脑电信号实战（附完整源码）

EEGNet + MNE 分类 Sample数据集一、环境配置 Package name Version Python3.7Tensorflow2.7.0mne0.24.1mat…

人工智能 2023年6月30日
00107
C++ 模板和泛型编程（掌握Vector等容器的使用）

1. 泛型泛型编程，一次编写就能泛化到各种数据类型，例如整数、浮点数、字符和布尔类型以及自己定义结构体、类。 C++通过模板的方式提供了泛型编程，包括函数模板和类模板，对应的…

人工智能 2023年6月4日
0083
【深度学习】(Multi-Head)Self-Attention (多头)自注意力机制 + Pytorch代码实现

文章目录一、序列标注二、全连接神经网络三、Window 四、Self – Attention 自注意力机制 * 4.1 简介 4.2 运行原理 4.3 QKV 五…

人工智能 2023年7月21日
00197

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

DC-CDN学习笔记

大家都在看