卷积层中的可分离卷积（Depthwis

2024年1月1日下午12:58 • 人工智能 • 阅读 46

引言

在深度学习中，卷积神经网络（Convolutional Neural Network, CNN）是一类广泛应用的神经网络结构。卷积层作为CNN的核心组成部分，通过提取图像的局部特征并共享权重参数来降低网络的参数数量。可分离卷积（Depthwise Separable Convolution）是一种有效的卷积层设计，可以在保持模型性能的同时减少参数和计算量。本文将详细介绍可分离卷积的算法原理、公式推导、计算步骤和Python代码示例，并解释代码的细节。

算法原理

可分离卷积由深度卷积（Depthwise Convolution）和逐点卷积（Pointwise Convolution）两个步骤组成。

深度卷积通过为输入的每个通道应用一个独立的滤波器（也称为卷积核）来进行卷积操作，以提取空间特征。对于输入形状为$[H, W, C_{in}]$的特征图，深度卷积使用大小为$[K, K, C_{in}, 1]$的滤波器集合，其中$K$为滤波器的大小，$C_{in}$为通道数。深度卷积的输出形状为$[H’, W’, C_{in}]$，其中$H’$和$W’$为特征图的高度和宽度。

逐点卷积是一个$1 \times 1$的卷积，被应用于深度卷积的输出通道上，以将其映射到所需的输出通道数。逐点卷积使用大小为$[1, 1, C_{in}, C_{out}]$的滤波器集合，其中$C_{out}$为输出通道数。逐点卷积的输出形状为$[H’, W’, C_{out}]$，其中$H’$和$W’$为特征图的高度和宽度。

可分离卷积的算法原理是将一个普通的卷积操作分解为两个步骤，从而减少了参数数量和计算量，提高了模型的计算效率。

公式推导

首先，我们定义输入的特征图为$X \in R^{H \times W \times C_{in}}$，深度卷积的滤波器为$D \in R^{K \times K \times C_{in} \times 1}$，逐点卷积的滤波器为$P \in R^{1 \times 1 \times C_{in} \times C_{out}}$。

深度卷积

深度卷积的输出可以表示为：

$$Y = X artical cgpt2md_gpt.sh cgpt2md_johngo.log cgpt2md_johngo.sh cgpt2md.sh _content1.txt _content.txt current_url.txt history_url history_urls log nohup.out online pic.txt seo test.py topic_gpt.txt topic_johngo.txt topic.txt upload-markdown-to-wordpress.py urls D$$

其中，$*$表示卷积操作。

逐点卷积

逐点卷积的输出可以表示为：

$$Z = Y artical cgpt2md_gpt.sh cgpt2md_johngo.log cgpt2md_johngo.sh cgpt2md.sh _content1.txt _content.txt current_url.txt history_url history_urls log nohup.out online pic.txt seo test.py topic_gpt.txt topic_johngo.txt topic.txt upload-markdown-to-wordpress.py urls P$$

将深度卷积的输出$Y$代入上式，可以得到逐点卷积的输出：

$$Z = (X artical cgpt2md_gpt.sh cgpt2md_johngo.log cgpt2md_johngo.sh cgpt2md.sh _content1.txt _content.txt current_url.txt history_url history_urls log nohup.out online pic.txt seo test.py topic_gpt.txt topic_johngo.txt topic.txt upload-markdown-to-wordpress.py urls D) artical cgpt2md_gpt.sh cgpt2md_johngo.log cgpt2md_johngo.sh cgpt2md.sh _content1.txt _content.txt current_url.txt history_url history_urls log nohup.out online pic.txt seo test.py topic_gpt.txt topic_johngo.txt topic.txt upload-markdown-to-wordpress.py urls P$$

展开并整理上式，可得：

$$Z = X artical cgpt2md_gpt.sh cgpt2md_johngo.log cgpt2md_johngo.sh cgpt2md.sh _content1.txt _content.txt current_url.txt history_url history_urls log nohup.out online pic.txt seo test.py topic_gpt.txt topic_johngo.txt topic.txt upload-markdown-to-wordpress.py urls (D artical cgpt2md_gpt.sh cgpt2md_johngo.log cgpt2md_johngo.sh cgpt2md.sh _content1.txt _content.txt current_url.txt history_url history_urls log nohup.out online pic.txt seo test.py topic_gpt.txt topic_johngo.txt topic.txt upload-markdown-to-wordpress.py urls P)$$

由此可见，可分离卷积可以分解为深度卷积和逐点卷积两个步骤。

计算步骤

可分离卷积的计算步骤如下：

对输入特征图进行深度卷积操作，使用大小为$[K, K, C_{in}, 1]$的滤波器集合。
将深度卷积的输出特征图与逐点卷积的滤波器集合进行逐点卷积操作，使用大小为$[1, 1, C_{in}, C_{out}]$的滤波器集合。
得到最终的输出特征图。

Python代码示例

下面是一个使用TensorFlow实现可分离卷积的Python代码示例。在示例中，我们使用一个虚拟的输入特征图作为示例输入数据，并设置深度卷积和逐点卷积的滤波器集合大小分别为3和32。

import tensorflow as tf

# 定义输入特征图
input_shape = [None, 256, 256, 3]
inputs = tf.placeholder(tf.float32, shape=input_shape)

# 定义深度卷积和逐点卷积的滤波器
depthwise_filter = tf.Variable(tf.random_normal([3, 3, 3, 1]))
pointwise_filter = tf.Variable(tf.random_normal([1, 1, 3, 32]))

# 执行深度卷积操作
depthwise_conv = tf.nn.depthwise_conv2d(inputs, depthwise_filter, strides=[1, 1, 1, 1], padding='SAME')

# 执行逐点卷积操作
output = tf.nn.conv2d(depthwise_conv, pointwise_filter, strides=[1, 1, 1, 1], padding='SAME')

# 初始化变量并运行计算图
init = tf.global_variables_initializer()
with tf.Session() as sess:
 sess.run(init)
 output_value = sess.run(output, feed_dict={inputs: <input_data>})

print(output_value.shape)

在上述代码中，我们使用了TensorFlow的tf.nn.depthwise_conv2d()和tf.nn.conv2d()函数来分别执行深度卷积和逐点卷积操作。其中，depthwise_conv2d()函数的输出作为conv2d()函数的输入。最后，我们打印输出特征图的形状。

代码细节解释

在代码的开头，我们定义了输入特征图的形状和占位符。这里使用tf.placeholder()来定义占位符，可以在运行计算图时提供输入数据。
接下来，我们定义了深度卷积和逐点卷积的滤波器。通过tf.Variable()函数创建变量，并使用tf.random_normal()函数对滤波器进行随机初始化。
在执行深度卷积和逐点卷积操作时，我们使用了TensorFlow的tf.nn.depthwise_conv2d()和tf.nn.conv2d()函数。这些函数分别对输入特征图执行深度卷积和逐点卷积操作，并返回输出特征图。
最后，我们使用tf.Session()创建一个会话，并在sess.run()中运行计算图。使用feed_dict参数向占位符提供输入数据。输出特征图的形状可以通过output_value.shape获取。

总结

本文介绍了可分离卷积的算法原理、公式推导、计算步骤和Python代码示例。可分离卷积通过将卷积操作分解为深度卷积和逐点卷积两个步骤，实现了减少参数数量和计算量的效果。通过理解和应用可分离卷积，我们可以设计出更高效的卷积神经网络。

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/822657/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

DGL-KE使用

DGL-KE是亚马逊开发的基于DGL 的知识图片嵌入库，提供了TransE,TransR等一系列嵌入方法，可以使用命令行的方式快速得到知识图谱中实体和关系的嵌入。我遇到一个需求，…

人工智能 2023年6月1日
0083
2018-DeepLabV3+论文解读

DeepLabV3+论文翻译 Encoder-Decoder with Atrous Separable Convolution for Semantic Image Segmen…

人工智能 2023年6月16日
00157
Java校园语音通信软件开发

随着通信技术的进步，利用网络进行语音通信已日益成熟和普及。网络的语音通信具有成本低、通信质量高的特点，在很多场景下已经取代了传统的语音通信手段。目前，软件市场上的网络语音通信软件种…

人工智能 2023年5月25日
0080
LSTM股票价格预测

ID：399899注：这里使用的数据源是Tushare LSTM股票价格预测实验实验介绍使用LSTM进行股票价格的预测，用到的框架主要包括：TensorFlow2.0，主要用…

人工智能 2023年5月23日
00104
Kaggle项目：酒店预订需求数据的探索与预测

EDA and Predictive Analysis of Hotel Booking Demand Datasets 2.0 数据背景:该数据集包含酒店预订相关信息，数据信息范…

人工智能 2023年7月7日
00103
知识图谱-词汇挖掘

*叙词表：叙词表又被称为主题词表，是一个针对特定学科领域的词汇表，也可以是涉及多个学科领域的综合性词汇表。改词汇表又一些雨衣相关的规范化名词术语组成。通常按照主题词首字母的顺序进…

人工智能 2023年6月1日
0049
使用neo4j import工具导入csv数据

参考文档官方链接（英文）https://neo4j.com/labs/apoc/4.3/import/import-csv/ 参考dalao文档链接https://blog.cs…

人工智能 2023年6月1日
0088
Tensorflow2梯度带tape.Gradient的用法_（全面，深入)

GradientTape是 eager模式下计算梯度用的，而 eager模式（eager模式的具体介绍请参考文末链接）是 TensorFlow 2.0的默认模式。通过 Gradi…

人工智能 2023年5月26日
0071
C++开发过程中的笔记

目录 1.#ifndef/#define/#endif 2.C++中map类型的使用 * 2.1 删除元素 2.2 map的用法 2.3 判断map中key值是否存在 3.虚函数后…

人工智能 2023年5月30日
0085
Focal loss 损失函数详解

Focal loss 目前目标检测的算法大致分为两类，One Stage 、Two Stage。 One Stage：主要指类似YOLO、SGD等这样不需要region propo…

人工智能 2023年7月28日
0060
Java面向对象三大特性(封装继承多态)解释及案例

文章目录 * – 包 – + * 包基本语法 * 命名规则 * 命名规范 * 导入包实例 – 访问修饰符 – 面向对象编程-封装 &…

人工智能 2023年6月29日
0072
【Python机器学习项目】项目一：心脏病二分类问题

使用机器学习预测心脏病根据一些病理学属性预测心脏病特别说明：开新坑啦！本系列共2个项目，难度不大，特别适合新手入坑由于本项目只是系列课程的第一个项目，所以很多细节不深挖，仅…

人工智能 2023年7月2日
00109
SVM模型详解

入门新秀，希望做笔记记录自己学到的东西，也希望能帮助同样入门级的人，也希望老板能帮忙改正错误~侵权删除。 [En] Entry rookie, hope to take notes…

人工智能 2023年5月27日
0062
使用BERT+BiGRU对京东手机评论进行情感分析

1. 设置参数，使模型结果具有可重现性（非必须）确定性操作通常比非确定性操作慢，因此您的模型的单次运行性能可能会降低。但是，确定性可以通过促进实验、调试和回归测试来节省开发时间。…

人工智能 2023年7月22日
0070
传出神经系统分为哪两类,传出神经的分类与功能

传出神经系统的分类是什么（一）按解学分类:1.自主神经系统（植物神经）:包括交感神经和副交感神经。它们自中枢神经系统发出后，都要经过神经节中的突触更换神经元，然后才到达所支配的器…

人工智能 2023年7月1日
0067
ISIS路由协议详解（特征、与OSPF对比、拓扑结构、专业术语、路由器分类、网络类型、DIS、报文类型及抓包、邻居关系、路由渗透、路由过载OL位、ISIS认证分类、ISIS管理标签以及各种实验等）

IS-IS特征：Isis：中间系统到中间系统链路状态路由协议IGP协议SPF算法ISIS采用TLV结构，因此扩展性很好（为支持新的协议和特性，只需要扩展新的TLV或子TLV；可以轻…

人工智能 2023年7月1日
00100

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31