卷积神经网络（CNN）的训练过程（Training）

2023年6月17日上午6:16 • 人工智能 • 阅读 101

在初识神经网络（初识卷积神经网络CNN）篇，对卷积神经网络有了基本的认识。

不过也可以发现一个问题，输入是一张Image，数据信息是确定的；但CNN网络中的数据从哪来？

总不能随便放一个数到CNN网络里，进行图像识别；

想要CNN网络进行正确的识别工作，CNN网络中的数据（weights）需要进行事先训练；那怎么训练这些数据，才能让CNN网络正常工作呢？

这里举一个简单的神经网络例子，说明如何训练CNN网络中的数据（weights）：

1 定义基础的神经网络模型：

下图是一个简单的神经网络模型：

（1）该神经网络由两个Fully-connected layers组成：

第一层Fully-connected layer，有两个kernels，第二层Fully-connected layer也是两个kernels，且大小均为211

（2）该神经网络的输入：

是由两个数据组成的Ifmap（Input Feature Map），大小为211

（3）将此Ifmap输入到该神经网络中，得到最后的输出类目：o1和o2

Ifmap—>神经网络—>o1,o2

2 初始化该神经网络

想要这个神经网络跑起来，已经有了输入的Ifmap数据，但是缺少神经网络中神经元的信息；所以，首先我们要进行初始化

初始化该神经网络中的4个kernels；由于是全连接层神经网络，该4个kernels的大小均为211，即211*4=8个数据

初始化4个kernels的偏置参数bias

给这8+4=12个数据一个随机化的数字，初始化该神经网络

3 进行前向推理

有了Ifmap，有了神经网络数据（weights+bias），此时我们就可以进行前向推理：

3.1 Ifmap经过神经网络第一层：

第一个Fully-connected layer的输入Ifmap数据就是（0.05， 0.10）

第一个kernel（w1=0.15,w2=0.20）的输出h1，就是：

同理，第二个kernel（w3=0.25,w4=0.30）的输出h2，就是:

给第一层Fully-connected layer加上一个Activation Function（Sigmoid）:

输出h1，h2，就变成：

3.2 第二层：

此时，喂给第二个Fully-connected layer的数据就是 (0.59327 , 0.59688)

第二层第一个kernel（w5=0.40,w6=0.45）的输出o1，就是：

同理，第二个kernel（w7=0.50,w8=0.55）的输出o2同样可以计算得出。

给第二个Fully-connected layer加上Activation Function（Sigmoid）：

此时（neto1,neto2）—>Sigmoid—>（o1,o2）

（o1,o2）=（0.75136507, 0.772928465）

4 更新网络

在第3节，得到经过初始化之后的神经网络的输出（0.75136507, 0.772928465）；

但是，我们期待的输出是类目2，即期待输出为：(0.01 , 0.99)

此时，我们就要计算误差，并更新神经网络

4.1 求出总误差：

结合实际输出和期待输出，求出总误差：

所以，o1输出端的误差：

同理，o2输出端的误差：

从而，得出总误差：

4.2 对weights求偏导：

有了总误差之后，对前面的权重数据weights改变多少，可以相应纠正这个误差，得到正确输出呢？

我们在这里就可以求得weights对结果的影响大小，即对weight求偏导：

以对w5求偏导举例，即：

4.2.1 偏导内容

问题：w5经过几次计算，到得出最后的总误差？

首先，h1经由w5到neto1，neto1经过sigmoid到outo1，最后，outo1经过误差方差到Etotal；

所以，Etoal对w5求偏导，即等于：

4.2.2 偏导的第一部分：

在上面公式中，偏导的第一部分可以计算得出：

偏导第一部分得到数据：0.74136507

4.2.3 偏导第二部分：

得到数据：0186815602

4.2.4 偏导第三部分：

得到第三部分数据：0.593269992

4.2.5 偏导输出：

所以，总误差对w5的偏导输出即为：

4.3 更新weight:

在4.2节，我们已经知道w5对最后误差的影响，从而可以往正确方向修正w5得到正确输出；此时会用到学习率，学习率的定义代表了在这个方向上的步子；

此时，我们就能得到修正后的w5：

至此，w5就得到更新；

至于w1,w2,w3,w4,w6,w7,w8的更新，可以用同样的方法求得；

4.4 迭代

所有weights更新完后，就可以重新推理过程

把新误差，再次对weights求导，更新神经网络

逐渐迭代，直至神经网络得到想要的输出，至此整个神经网络训练完成。

5 一些问题：

在第4步，只是一个简单的训练原理，在实际中，会遇到各种问题；比如，过拟合，欠拟合…，等等，需要着手调整和解决

同时，学习率的挑选，也不能很随意；

这些问题，在实际过程中，都会遇到。

参考：

[1] https://mattmazur.com/2015/03/17/a-step-by-step-backpropagation-example/

[2]https://towardsdatascience.com/understanding-learning-rates-and-how-it-improves-performance-in-deep-learning-d0d4059c1c10

Original: https://blog.csdn.net/huayangshiboqi/article/details/121174972
Author: huayangshiboqi
Title: 卷积神经网络（CNN）的训练过程（Training）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/628968/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

mysql实现知识图谱_构建知识体系的知识图谱

知识图谱知识图谱(摘要)mp.weixin.qq.com neo4J安装下载解压即可 wget -c https://neo4j.com/artifact.php?name=…

人工智能 2023年6月10日
0085
【深度强化学习】多智能体算法汇总

0 Preliminaries 在多智能体强化学习算法中，两个主要的技术指标为合理性与收敛性。合理性（rationality）：在对手使用一个恒定策略的情况下，当前智能体能够学习…

人工智能 2023年6月16日
00102
Python 【问题描述】按照世卫组织的标准：男性：（身高cm-80）×70%=标准体重女性：（身高cm-70）×60%=标准体重标准体重正负10%为正常体重(含10%) 标准体重正负1

【问题描述】按照世卫组织的标准：男性：（身高cm-80）×70%=标准体重女性：（身高cm-70）×60%=标准体重标准体重正负10%为正常体重(含10%) 标准体重正负10…

人工智能 2023年7月9日
0088
图像去雾算法综述

图像去雾算法图像去雾算法研究综述（魏红伟，田杰，肖卓朋）图像去雾算法的综述及分析（王道累，张天宇）一. 基于图像增强的去雾算法1. 直方图均衡化（1）直方图均衡化…

人工智能 2023年6月18日
00103
基于片内Flash的提示音播放程序

1）实验数据准备：用Adobe audition或goldwave等音频编辑软件录制”您好欢迎光临！”的几秒钟的声音（8khz采样、8bit量化编码的单声道…

人工智能 2023年5月23日
0079
相机标定-张正友棋盘格标定法

目录 1.针孔相机模型 2.相机成像过程 2.1 各个坐标系之间的转换 2.1.1 图像坐标系到像素坐标系 2.1.2 相机坐标系到图像坐标系 2.1.3世界坐标系到相机坐标系 2…

人工智能 2023年6月18日
00117
Pytorch-NLU，一个中文文本分类、序列标注(实体识别、分词、词性标注)的极简工具包，基于pytorch与tramsforers

Pytorch-NLU是一个只依赖pytorch、transformers、numpy、tensorboardX，专注于文本分类、序列标注的极简自然语言处理工具包。支持BERT、E…

人工智能 2023年5月31日
0095
论文阅读之 Omni-Scale Feature Learning for Person Re-Identification

相关链接论文链接：Omni Scale_Feature_Learning_for_Person_Re-Identification_ICCV_2019_paper.pdf 代码链…

人工智能 2023年7月10日
0073
数据科学学习之统计实验的设计、检验与分析

专栏/前文链接本文为《数据分析与数据科学》专栏中的第三篇，专栏的链接在这里. 第一篇博文的链接在这里. 第二篇博文的链接在这里. 希望本文与此专栏能够对接触，学习和研究数据科学的…

人工智能 2023年7月18日
0058
初探三维计算机视觉（三维重建） —— 相机模型 + 双目系统 + 点云模型

初探三维计算机视觉（三维重建）—— 相机模型 + 双目系统 + 点云模型目录 * – 初探三维计算机视觉（三维重建）—— 相机模型 + 双目系统 + 点云模型 &#8…

人工智能 2023年7月18日
00167
Python基于Flask框架实现Websocket通信（待更新）

Websocket 和 Http WebSocket 是 HTML5 出的东西（协议），也就是说HTTP协议没有变化，或者说没关系，但HTTP是不支持持久连接的（长连接，循环连接的…

人工智能 2023年7月6日
00134
【paper笔记】Learning Intents behind Interactions with Knowledge Graph

文章基本信息 Learning Intents behind Interactions with Knowledge Graph WWW2021 CCF-A 论文地址: KGIN …

人工智能 2023年6月10日
0075
目标跟踪（7）使用 OpenCV 进行简单的对象跟踪

1.简述目标跟踪的过程是: 1.获取对象检测的初始集(例如边界框坐标的输入集) 2.为每个初始检测创建唯一的ID 3.然后跟踪每一个在视频中移动的对象，保持唯一ID的分配此外，…

人工智能 2023年7月20日
0081
PPO2代码 pytorch框架

PPO2代码玩gym库的Pendulum环境 2022-8-02更新我发现这篇文章浏览量惨淡啊。咋滴，是不相信的我代码能用是吗？所以，我给出reward的收敛曲线图：开玩笑，…

人工智能 2023年7月5日
0084
R语言矩阵运算：矩阵转置、计算逆矩阵、两个矩阵的相乘、构建nxn对角（单位）矩阵

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月15日
0070
时间序列学习经典案例（1）【tsfresh】预测多只股票

0.关于代码内容和前置知识学习点击这里 1.背景将使用 Google、Facebook 和 Alphabet 的股票进行任务。 2.获取数据 %matplotlib inlin…

人工智能 2023年7月18日
0055

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31