动手实现深度学习（12）：卷积层的实现与优化（img2col）

2023年10月25日上午9:19 • Python • 阅读 47

卷积的计算过程网上的资料已经做够好了，没必要自己再写一遍。只把资料搬运到这里：

这里总结一下有padding\stride的卷积操作:

假设，输入大小为（H,W,C）,fileter大小为（FH，FW,C）*N ; padding=P, stride=S,卷积后的形状为(OH,OW,OC)

卷积的backward是对卷积的求导。

代码实现如下：

再讲卷积的实现之前，首先抛出一个问题：如果按照上述的卷积方式计算，是否会影响性能？

答案是肯定会受影响的。

因此，我们需要向优化一下conv的计算方式.

按照”以空间换时间”的思想，我们可以做一些优化，使得在conv和pool的时候运算速度加快。

首先，我们知道Numpy对大型矩阵的运算是有做优化的，这个特点我们应该好好利用；

其次，我们知道Numpy在做多个嵌套的for循环的时候，O(n)会很大；应该避免做多个for循环；

因此，要是将4D的卷积运算转换成2D的矩阵乘法就会好很多；filter也可以变成2D的数组；

Im2col便是将4D数据转换成2D矩阵的函数。

该函数大致的思路是：filter按照行列展开成一个2D矩阵即可，input_data按照计算的单元重新组合。因此需要写一个函数将图像转换成2D矩阵，该函数可以将图像展开成适合与滤波去做乘法的矩阵。

展开和计算的流程如下：

对filter计算有影响的因素有input_data,filter_h，filter_w，stride, padding；im2col会应该根据以上的因因素展开input_data,展开后的input_data一定是比之前要大的；

我们可以尝试计算一下input_data展开后的数据形状：

假设，输入数据为443大小的tensor; filter有两个为2（22*3），filter_h=2，filter_w=2,stride=1, padding=0；这里可以计算出展开以后的大小：

Filter为有两个，分别为f1和f2; shape=（223）, 按照行展开成2D的矩阵以后如下图所示：

Input_data为443的tensor,如下图所示：

Input_data首先会找出filter对应的计算单元，这些还是需要padding\stride\filter_w\filter_h相关，找出计算的单元以后，按照行展开。最后得到的数据便是im2col的结果：

Input_data和filter这样展开以后，卷积计算就可以按照矩阵乘法的方式计算，避免了重复的for循环。如下图所示，黑色和灰色区域是计算的结果。不必担心矩阵过大是否会影响计算速度，Numpy对大规模矩阵乘法内部有优化加速，这样展开以后恰恰也能充分的利用numpy的特性。

Im2col的实现：

测试代码：

========输出：可以发现和上面的绘图的结果是一致的 =====

(1, 3, 4, 4)

[[3. 0. 6. 5. 1. 2. 3. 0. 4. 2. 1. 2.]

[0. 4. 5. 4. 2. 0. 0. 2. 2. 0. 2. 0.]

[4. 2. 4. 3. 0. 1. 2. 4. 0. 1. 0. 4.]

[6. 5. 3. 0. 3. 0. 1. 0. 1. 2. 3. 0.]

[5. 4. 0. 2. 0. 2. 0. 3. 2. 0. 0. 4.]

[4. 3. 2. 3. 2. 4. 3. 2. 0. 4. 4. 2.]

[3. 0. 1. 0. 1. 0. 4. 3. 3. 0. 6. 2.]

[0. 2. 0. 3. 0. 3. 3. 0. 0. 4. 2. 4.]

[2. 3. 3. 1. 3. 2. 0. 1. 4. 2. 4. 5.]]

卷积操作也需要实现forward和backward函数。

Forward函数中用到了9.1\9.2的im2col

输入：input_data\filters

输出：output

测试代码：

Conv的输出结果，与上图的结果一致。

Original: https://www.cnblogs.com/greentomlee/p/16686862.html
Author: 修雨轩陈
Title: 动手实现深度学习（12）：卷积层的实现与优化（img2col）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/804854/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Flask 项目打包线上部署

文章目录 * – + 图床简介 + Flask代码 + Gunicorn || gevent + 编写gunicorn配置文件 + 导出依赖 + 编写dockerfil…

Python 2023年8月10日
0061
Django日志详解

1. 叙述 Django对于日志输出的信息是很完善的，request的信息，setting配置，trackback的信息，一应俱全，足够我们调试了。但是在线上环境，如果让用户看到这…

Python 2023年8月4日
0047
Scrapy + selenium + 超级鹰验证码识别爬取网站

目录一、安装Scrapy 二、Scrapy项目生成三、爬取某个网站（以下我用之前的创建的项目，不是刚刚新创的）一、安装Scrapy 1，window安装 pip instal…

Python 2023年10月1日
0042
Python生成requirements.txt的两种方法

只导出当前环境使用的依赖包 python3 -m pip install pipreqs pipreqs . –encoding=utf8 –force –encoding=…

Python 2023年8月11日
0065
pytorch：.cuda() & .cpu() & .data & .numpy()

pytorch：.cuda() & .cpu() & .data & .numpy() a.cuda().data.cpu().numpy() a.cuda…

Python 2023年8月24日
0038
go的命令行库–cobra使用

Cobra是一个用于创建强大的现代CLI应用程序的库。Cobra被用于许多go项目中，如Kubernetes, Hugo和Github CLI等。官方列举了使用cobra库的列表 …

Python 2023年11月8日
0033
Python unittest基本框架组成（1）

Python unittest基本框架组成（1）原创小嘉欣0082022-08-11 11:27:25©著作权文章标签 python unittest 测试用例 python…

Python 2023年5月24日
0070
新建Maui工程运行到IiOS物理设备提示 Could not find any available provisioning profiles for iOS 处理办法

在构建 MAUI App 或 MAUI Blazor 时，您可能会收到以下 Could not find any available provisioning profiles f…

Python 2023年10月15日
0071
给Jupyter Notebook增添/删除kernel

引言对于新建的一个conda环境，经常希望其能在notebook里运行，所以简单记录一下流程首先，需要安装ipykernel pip install ipykernel 增添k…

Python 2023年6月12日
0063
关于pytest分布式多线程运行测试用例报错及解决办法，附实例

先抛成果，分布式执行测试用例，比正常执行测试用例，节约了很多时间。如图：windows下想用多进程用pytest-xdist(不支持多线程），想用多线程用pytest-parall…

Python 2023年9月10日
0054
python 中，sklearn包下的f1_score、precision、recall使用方法，Accuracy、Precision、Recall和F1-score公式，TP、FP、TN、FN的概念

目录 sklearn.metrics.f1_score sklearn.metrics.precision_score sklearn.metrics.recall_score A…

Python 2023年8月2日
00100
pandas.cut()函数的使用

函数可以将数据进行分类成不同的区间值。在数据分析中，例如有一组年龄数据，现在需要对不同的年龄层次的用户进行分析，那么我们可以根据不同年龄层次所对应的年龄段来作为划分区间，例如 bi…

Python 2023年8月2日
0056
DataWhale : hands-on-data-analysis 第二章（数据清洗与处理篇）

“拿到数据的第一步是进行数据清洗，本章我们将学习缺失值、重复值、字符串和数据转换等操作，将数据清洗成可以分析或建模的样子。” 开始第二章学习之前，首先要导入…

Python 2023年8月7日
0047
数据挖掘01-相关性分析及可视化【Pearson, Spearman, Kendall】

数据挖掘01-相关性分析及可视化【Pearson, Spearman, Kendall】 * – 简介 – 一、什么是相关性分析 – 二、常见的…

Python 2023年8月2日
0061
知识表示学习（三）：TransR

一.摘要知识图谱补全旨在执行实体之间的链接预测。在本文中，我们考虑了知识图嵌入的方法。最近，诸如 TransE 和 TransH 等模型通过将关系视为从头实体到尾实体的翻译来…

Python 2023年10月9日
0041
DataFrame数据分析

注：文中用到的数据文件可以在资源中免费获取。基本统计常用统计函数表非空元素计算最小值最大值最小值的位置最大值的位置 )10%分位数中位数标准差平均绝对偏差一次…

Python 2023年8月18日
0031

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

动手实现深度学习（12）： 卷积层的实现与优化（img2col）

大家都在看

动手实现深度学习（12）：卷积层的实现与优化（img2col）