机器学习整理（神经网络）

2023年7月14日下午3:17 • 人工智能 • 阅读 55

神经元

神经网络由多个神经元组成，其中神经元由几个部分组成：输入、输入权重、输出和激活函数组成，类似于生物神经元的树突、轴突的组成。

神经元的输入由左边的神经元输出 xxx 乘以权重 www 并加和得到，输出的时候，类似于生物神经元的轴突，将神经元的输出通过激活函数才能传送给接下来的神经元。

常用的激活函数（activation function）是Sigmod，它的函数图像如下，在逻辑回归的时候使用过：

其中偏置单元 bbb 是用于提高神经网络的灵活性而加入的，它的存在可以让激活函数更快或者更慢达到激活状态。

神经网络

多个神经元组层一个神经网络：

神经网络第一层是输入层（input），最后一层是输出层（output），而中间的就是神经网络的隐藏层（hidden layer）

神经网络的训练过程如下：

前向传播

前向传播的过程目的是计算出神经网络的输出：

首先开始计算 net0net0net_0 :

net0=w0∗x0+w2∗x1+b0∗1net0=w0∗x0+w2∗x1+b0∗1net_0 = w_0 * x_0 + w_2 * x_1 + b_0 * 1
到达隐藏层的神经元后，会通过激活函数作为神经元的输出 a0a0a_0：

a0=Sigmoid(net0)=11−e−net0a0=Sigmoid(net0)=11−e−net0a_0 = Sigmoid(net_0) = \frac{1}{1-e^{-net_0}}
计算该神经元后继续向前计算，和前面一层的计算类似：

o0=Sigmoid(w4∗a0+w6∗a1+b2∗1)o0=Sigmoid(w4∗a0+w6∗a1+b2∗1) o_0 = Sigmoid(w_4 * a_0 + w_6 * a_1 + b_2 * 1)
按照这样的传播过程，这样就能计算出神经网络的输出 o1,o2,…,ono1,o2,…,ono_1,o_2,\dots,o_n ，即神经网络的前向传播，就像把样本 xxx 代入y=ax+by=ax+by = ax + b里求出 yyy 值的过程一样。

反向传播

按照神经网络的训练过程，接下来是希望计算代价函数 J(W)J(W)J(W) ，并求出 J(W)J(W)J(W) 对 wiwiw_i 的偏导数 ∂J(W)∂wi∂J(W)∂wi\frac{\partial J(W)}{\partial w_i} ，并按照学习率 aaa 更新参数：

wi=wi−a∗∂J(W)∂wiwi=wi−a∗∂J(W)∂wiw_i = w_i – a * \frac{\partial J(W)}{\partial w_i}
以更新 w5w5w_5 为例，如果需要知道 ∂J(W)∂w5∂J(W)∂w5\frac{\partial J(W)}{\partial w_5} 的值，根据链式求导法则：

∂J(W)∂w5=∂J(W)∂o1∗∂o1∂net3∗∂net3∂w5∂J(W)∂w5=∂J(W)∂o1∗∂o1∂net3∗∂net3∂w5\frac{\partial J(W)}{\partial w_5} = \frac{\partial J(W)}{\partial o_1 } * \frac{\partial o_1}{\partial net_3} * \frac{\partial net_3}{\partial w_5}

（1）首先求∂J(W)∂o1∂J(W)∂o1\frac{\partial J(W)}{\partial o_1 } ，其中 J(W)J(W)J(W) 是代价函数，这里用均方误差来计算误差，yyy 是样本的结果，那么表达式就是：

J(W)=12∑i=1m(yi−oi)2=12(y0−o0)2+12(y1−o1)2J(W)=12∑i=1m(yi−oi)2=12(y0−o0)2+12(y1−o1)2J(W) = \frac{1}{2}\sum_{i=1}^{m}(y_i – o_i)^2 = \frac{1}{2}(y_0 – o_0)^2 + \frac{1}{2}(y_1 – o_1)^2
其中对 o1o1o_1 的偏导数为：

∂J(W)∂o1=0+2∗12(y1−o1)∗−1=−(y1−o1)∂J(W)∂o1=0+2∗12(y1−o1)∗−1=−(y1−o1)\frac{\partial J(W)}{\partial o_1 } = 0 + 2 * \frac{1}{2} (y_1 – o_1) * -1 = -(y_1 – o_1)
（2）然后是求 ∂o1∂net3∂o1∂net3\frac{\partial o_1}{\partial net_3}：

o1=Sigmoid(net3)o1=Sigmoid(net3)o_1 = Sigmoid(net_3)
其中对 net3net3net_3 的偏导数为：

∂o1∂net3=Sigmoid(net3)′=Sigmoid(net3)∗(1−Sigmoid(net3)∂o1∂net3=Sigmoid(net3)′=Sigmoid(net3)∗(1−Sigmoid(net3)\frac{\partial o_1}{\partial net_3} = Sigmoid(net_3)’ = Sigmoid (net_3) * (1 – Sigmoid(net_3)
激活函数Sigmoid的函数 f(x)f(x)f(x) 的导数等于 f(x)∗(1−f(x))f(x)∗(1−f(x))f(x)*(1-f(x)) ，见证明。

（3）最后是求 ∂net3∂w5∂net3∂w5\frac{\partial net_3}{\partial w_5} :

net3=w5∗a0+w7∗a1+b1net3=w5∗a0+w7∗a1+b1net_3 = w_5 * a_0 + w_7 * a_1 + b_1
∂net3∂w5=a0∗1+0=a0∂net3∂w5=a0∗1+0=a0\frac{\partial net_3}{\partial w_5} = a_0 * 1 + 0 = a_0
所以最终求得偏导项：

∂J(W)∂w5=−(y1−o1)∗Sigmoid(net3)∗(1−Sigmoid(net3))∗a0∂J(W)∂w5=−(y1−o1)∗Sigmoid(net3)∗(1−Sigmoid(net3))∗a0\frac{\partial J(W)}{\partial w_5} = -(y_1 – o_1) * Sigmoid (net_3) * (1 – Sigmoid(net_3)) * a_0
而 w5w5w_5 也能在反向传播中更新自己的权重，通过减去 a∗∂J(W)∂w5a∗∂J(W)∂w5a * \frac{\partial J(W)}{\partial w_5}。

第三个导数项求偏导时都会等于上一层的激活函数的输出值，如果把前两个导数项 ∂J(W)∂oi∗∂oi∂neti∂J(W)∂oi∗∂oi∂neti\frac{\partial J(W)}{\partial o_i } * \frac{\partial o_i}{\partial net_i} 用符号 δiδi\delta_i 代替的话，那么：
∂J(W)∂w5=ajδi∂J(W)∂w5=ajδi\frac{\partial J(W)}{\partial w_5} = a_j\delta_i

如果要更新隐藏层的权重 w1w1w_1 ，则

∂J(W)∂w1=∂J(W)∂a0∗∂a0∂net0∗∂net0∂w1∂J(W)∂w1=∂J(W)∂a0∗∂a0∂net0∗∂net0∂w1\frac{\partial J(W)}{\partial w_1} = \frac{\partial J(W)}{\partial a_0 } * \frac{\partial a_0}{\partial net_0} * \frac{\partial net_0}{\partial w_1}
因为 ∂J(W)∂a0∂J(W)∂a0\frac{\partial J(W)}{\partial a_0 } 同时受到 o0o0o_0 和 o1o1o_1 的影响，所以：

∂J(W)∂w1=(∂J(W)0∂a0+∂J(W)2∂a0)∗∂a0∂net0∗∂net0∂w1∂J(W)∂w1=(∂J(W)0∂a0+∂J(W)2∂a0)∗∂a0∂net0∗∂net0∂w1\frac{\partial J(W)}{\partial w_1} = (\frac{\partial J(W)_0}{\partial a_0 } + \frac{\partial J(W)_2}{\partial a_0 }) * \frac{\partial a_0}{\partial net_0} * \frac{\partial net_0}{\partial w_1}
其中 J(W)0J(W)0J(W)_0 代表在 o0o0o_0 的损失，计算和前面的规则类似，依次根据链式求导规则展开即可对给定的 (xi,yi)(xi,yi)(x_i, y_i) 拟合。

其他资料

在这里基本打开了神经网络的大门，虽然目前学到只是一个全连接网络和基本的BP算法，但是在这篇文章中可以看到还有支持增量学习的自适应谐振理论网络（ART），以及自动连接神经元的自我组织网络（SOM）等等网络架构。

其他我用到的资料：

Original: https://blog.csdn.net/qq_45562973/article/details/124089760
Author: 洛蕾
Title: 机器学习整理（神经网络）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/692318/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

利用Python识别txt文本并根据其内容进行文件分类

事情是这样的，有一个图片数据集需要根据分成很多类以便于给其设置标签，但所有的图片都在一个文件里，另外又给了个.txt文件，其中每行都是对应图片的类别。例如第1行对应的第0001.j…

人工智能 2023年7月1日
0098
python kmeans包的使用_使用Python实现KMeans算法

简介通过使用python语言实现KMeans算法，不使用sklearn标准库。 [TencentCloudSDKException] code:FailedOperation.S…

人工智能 2023年6月2日
00102
有什么五百左右的蓝牙耳机推荐？五百左右的蓝牙耳机推荐

电子产品可以说是更新换代最快的了，近几年随着airpods的爆火，无线蓝牙耳机逐渐以方便、简洁的优势占领耳机市场。我本人也鼓捣耳机好多年了，蓝牙耳机更是我的心头好。”蓝…

人工智能 2023年5月25日
0094
py2neo+Neo4j初体验

这里写目录标题简介安装与沙箱使用 py2neo 问题记录简介图数据库是做知识图谱的好东东。当然，还可以做很多东西：数据可视化、复杂网络不社会网络分析等目前市面上有很多种，排…

人工智能 2023年6月1日
0096
卷积神经网络学习—Resnet50（论文精读+pytorch代码复现）

前言一、Resnet论文精读 * 引入残差残差块 ResNet50模型基本构成 BN层 Resnet50总体结构二、Resnet50代码复现 * 完整代码前言如果说在CN…

人工智能 2023年7月12日
0065
Deep Learning之带你详细了解回声状态网络（ESN）

Abstract 首先呢写本篇博客的灵感来源于我在学习RNN（循环神经网络）时对于如何解决其循环结构，参数共享带来的长期依赖问题，我将在（一）中简要叙述RNN引出本文主角ESN（回…

人工智能 2023年6月25日
00163
【机器学习】如何去评价一个神经网络模型的好坏？什么是交叉验证数据集？偏差和高差对模型的影响？

系列文章目录第十二章 Python 机器学习入门之构建机器学习系统目录系列文章目录前言一、如何评估一个模型的性能二模型的选择和交叉验证数据集的训练方法三通过偏差和…

人工智能 2023年7月15日
0079
labelme批量制作数据集

上一篇记录了labelme的安装及简单使用，接下来记录将labelme标注后json文件转化为训练数据 1. 单个json文件转换为png数据 labelme自带的labelme_…

人工智能 2023年7月10日
0066
【css 动画】css实现奔跑的北极熊

📋 个人简介 💖 作者简介：大家好，我是阿牛，全栈领域优质创作者😜 📝 个人主页：馆主阿牛🔥 🎉 支持我：点赞👍+收藏⭐️+留言📝 📣 系列专栏：前端实用小demo🍁 💬格言：迄今…

人工智能 2023年6月20日
0083
【机器学习】SVM算法

目录什么是SVM SVM 基本概念 SVM相关问题 SVM算法原理点到超平面的距离公式最大间隔的优化模型松弛变量核函数：线性不可分—高维可分 SVM实现对鸢尾花数据集的二…

人工智能 2023年6月16日
0080
SpringBoot的创建的使用

哈喽呀，你好呀，欢迎呀，快来看一下这篇宝藏博客吧~~~ 目录 1、Spring Boot快速扫盲 2、Spring Boot 项目创建 3、运行项目 4 、输出hello worl…

人工智能 2023年7月30日
0061
AIR32F103(一) 合宙AIR32F103CBT6开发板上手报告

目录 AIR32F103(一) 合宙AIR32F103CBT6开发板上手报告 AIR32F103(二) Linux环境和LibOpenCM3项目模板 AIR32F103(三) Li…

人工智能 2023年6月25日
00109
启明智显分享|乐鑫ESP32-S3离线语音在86控制面板、温控器的应用

提示：启明智显基于乐鑫ESP32-S3与国产芯高效开发平台8ms(8ms.xyz)设计开发的一款可快速开发86智能开关、温控器的串口屏已批量应用于86智能开关\温控器解决方案 MC…

人工智能 2023年5月25日
00108
分类案例：XGB中的样本不均衡问题

参数设置分类问题中经常会存在样本不平衡的现象，XGB 中存在着调节样本不平衡的参数 scale_pos_weight，通常我们在参数中输入的是负样本量与正样本量之比分类案例创…

人工智能 2023年7月2日
0082
疫情可视化(后续)

前言此系列已完结，共3部分： part1：https://blog.csdn.net/xi1213/article/details/126824752 part2：https:/…

人工智能 2023年6月28日
0091
【mmdetection】使用coco数据集训练后结果可视化

目录一.开始二.可视化代码 * 1. Loss曲线 2. P-R曲线 3.mAP参数 4.fps参数 5.acc曲线 6.计算FLOPs和参数量三.参数意义及总结一.开始 …

人工智能 2023年6月17日
00197

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

机器学习整理（神经网络）

神经元

神经网络

前向传播

反向传播

其他资料

大家都在看