神经网络的入门

2023年8月28日下午1:07 • Python • 阅读 36

神经网络的介绍

神经元：多个输入—->权重—>偏置—>激励函数—>输出
符号表示：x为输入函数，W为权重，b为偏置常量，f为激励函数，y为输出
则y = f （ ∑ （ x i ∗ w i + b ) ） y=f（\sum（x_i * w_i+b)）y =f （∑（x i ∗w i +b )）

在神经网络中，网络层包括 输入层， 中间层（隐藏层）， 输出层。
正向传播：从转递输入信息到产生输出的过程
反向传播：从输出向输入逆向传递信息的过程
符号表示：
前面网络层有m个，后面网络层有n个。则Wij：前面网络层i对后面网络层j的权重，W为m *n的矩阵。
上层网络层有m个神经元，即上层网络的输出向量的元素为m。
i作为上层网络的下标，j作为下层网络的下标。
Y i = X j = ( x 1 , x 2 , x 3 . . . x m ) Y_i=X_j=(x_1,x_2,x_3…x_m)Y i =X j =(x 1 ,x 2 ,x 3 …x m ) 下层网络层的每一个神经元都有m个输入
下层神经网络的神经元偏置B j = （ b 1 ， b 2 , b 3 . . . b n ) B_j=（b_1，b_2,b_3…b_n)B j =（b 1 ，b 2 ,b 3 …b n )

下层神经网络的输出为Y j = ( y 1 , y 2 , y 3 . . . y n ) Y_j=(y_1,y_2,y_3…y_n)Y j =(y 1 ,y 2 ,y 3 …y n )

则Y j = f （ ∑ ( X j ∗ W i j ) + B j ) Yj=f（\sum(X_j *W_{ij})+B_j)Y j =f （∑(X j ∗W i j )+B j )

回归问题：连续性问题
分类问题：离散问题

神经网络的架构

numpy.where(x0,0,1)

numpy.where(1/1+exp(-x))

sigmid的导数：y ′ = （ 1 − y ) ∗ y y’=（1-y)*y y ′=（1 −y )∗y

numpy内置tanh函数：t a n h （ x ) = ( e x p ( x ) − e x p ( − x ) ) ( e x p ( x ) + e x p ( − x ) ) tanh（x)=\frac{(exp(x)-exp(-x))}{(exp(x)+exp(-x))}t a n h （x )=(e x p (x )+e x p (−x ))(e x p (x )−e x p (−x ))

numpy.tanh(x)

numpy.where(x0,0,x)

numpy.where(x0,0.01*x,x)

对于ReLU的优化，对负数区域增加小的梯度避免出现：dying ReLU现象

用于输出回归函数的输出层：y=x

y = e x p ( X ) / ∑ e x p ( X k ) y=exp(X)/\sum exp(X_k)y =e x p (X )/∑e x p (X k )

numpy.exp(x)/numpy.sum(numpy.exp(x))

对输出与正确答案的误差进行定义的函数就是损失函数

E = 1 2 ∑ ( y k − t k ) 2 E=\frac{1}{2}\sum(y_k-t_k)^2 E =2 1 ∑(y k −t k )2

其中 E 表示误差，y k y_k y k 表示输出层的各个输出值，t k t_k t k 表示正确答案

import numpy as np
def square_sum(y,t):
    1.0/2.0*np.sum(np.square(y-t))

E = − ∑ t k l o g ( y k ) E=-\sum t_klog(y_k)E =−∑t k l o g (y k )

其中 E 表示误差，t k t_k t k 表示正确答案，y k y_k y k 表示输出答案，由于t k t_k t k 是独热编码，故只有唯一正确为1的项对误差产生影响。

import numpy as np
def cross_entropy(y,t):
    return -np.sum(t*np.log(y+1e-7))

∆ω \omega ω=φ y i y j \varphi y_i y_j φy i y j

其中Δ ω \Delta \omega Δω 表示为连接强度（权重）的变化量，φ \varphi φ 为一常量， y i y_i y i 表示为突触前膜神经元的兴奋程度,y j y_j y j 表示为突触后膜神经元的兴奋程度。

意义：突触前膜和突触后膜产生的兴奋使突触的能量传递效率增强。与之相反，长时间没有兴奋，突触的能量传递效率衰退。

Δ ω = η ( y j − t ) y i \Delta\omega=\eta(y_j-t)y_i Δω=η(y j −t )y i

其中Δ ω \Delta \omega Δω 表示为权重的变化量，y i y_i y i 突触的前神经元的输出，y j y_j y j 表示突触的后神经元的输出，t表示正确答案，η \eta η表示学习系数的常数。

意义：

如果输出与正确答案之间的差值越大，则需要设置的权重的修正量也越大。
如果输入越大，则需要设置的权重的修正量也越大。
随机梯度下降法(SGD)
Momentum
AdaGrad
RMSProp
Adam

更新公式：
w ← w − η ∂ E ∂ w w\leftarrow w-\eta\frac{∂ E}{∂ w}w ←w −η∂w ∂E

b ← b − η ∂ E ∂ b b\leftarrow b-\eta\frac{∂ E}{∂ b}b ←b −η∂b ∂E

优点：随机选样本，不容易掉入局部最优解。简单确定更新量，简单的代码实现。

缺点：在学习的过程中无法对更新量灵活调整

w ← w − η ∂ E ∂ w + α Δ w w\leftarrow w-\eta\frac{∂ E}{∂ w}+\alpha\Delta w w ←w −η∂w ∂E +αΔw

b ← b − η ∂ E ∂ b + α Δ b b\leftarrow b-\eta\frac{∂ E}{∂ b}+\alpha\Delta b b ←b −η∂b ∂E +αΔb

α \alpha α决定惯性的强度常量，Δ w \Delta w Δw表示前一次的更新量

优点：防止更新量的急剧变化

缺点：必须事先给定η \eta η和 α \alpha α，增加网络调整的难度。

h ← h + ( ∂ E ∂ w ) 2 h\leftarrow h+(\frac{∂ E}{∂ w})^2 h ←h +(∂w ∂E )2

w ← w − η 1 h ∂ E ∂ w w\leftarrow w-\eta\frac{1}{\sqrt{h}}\frac{∂ E}{∂ w}w ←w −ηh 1 ∂w ∂E

h ← h + ( ∂ E ∂ b ) 2 h\leftarrow h+(\frac{∂ E}{∂ b})^2 h ←h +(∂b ∂E )2

b ← b − η 1 h ∂ E ∂ b b\leftarrow b-\eta\frac{1}{\sqrt{h}}\frac{∂ E}{∂ b}b ←b −ηh 1 ∂b ∂E

优点：对更新量进行调整

缺点：更新量持续减少

h ← ρ h + ( 1 − ρ ) ( ∂ E ∂ w ) 2 h\leftarrow \rho h+(1-\rho)(\frac{∂ E}{∂ w})^2 h ←ρh +(1 −ρ)(∂w ∂E )2

w ← w − η 1 h ∂ E ∂ w w\leftarrow w-\eta\frac{1}{\sqrt{h}}\frac{∂ E}{∂ w}w ←w −ηh 1 ∂w ∂E

h ← ρ h + ( 1 − ρ ) ( ∂ E ∂ b ) 2 h\leftarrow \rho h+(1-\rho)(\frac{∂ E}{∂ b})^2 h ←ρh +(1 −ρ)(∂b ∂E )2

b ← b − η 1 h ∂ E ∂ b b\leftarrow b-\eta\frac{1}{\sqrt{h}}\frac{∂ E}{∂ b}b ←b −ηh 1 ∂b ∂E

ρ \rho ρ一般设置为0.9。

m 0 = v 0 = 0 m_0=v_0=0 m 0 =v 0 =0

m t = β 1 m t − 1 + ( 1 − β 1 ) ∂ E ∂ w m_t=\beta_1m_{t-1}+(1-\beta_1)\frac{∂ E}{∂ w}m t =β1 m t −1 +(1 −β1 )∂w ∂E

v t = β 2 v t − 1 + ( 1 − β 2 ) ( ∂ E ∂ w ) 2 v_t=\beta_2v_{t-1}+(1-\beta_2)(\frac{∂ E}{∂ w})^2 v t =β2 v t −1 +(1 −β2 )(∂w ∂E )2

m t ^ = m 0 t 1 − β 1 t \hat{m_t}=\frac{m_{0t}}{1-\beta_1^t}m t ^=1 −β1 t m 0 t

v t ^ = v t 1 − β 2 t \hat{v_t}=\frac{v_t}{1-\beta_2^t}v t ^=1 −β2 t v t

w ← w − η m t ^ v t ^ + ο w \leftarrow w-\eta\frac{\hat{m_t}}{\sqrt{\hat{v_t}}+\omicron}w ←w −ηv t ^+οm t ^

t表示重复次数

Original: https://blog.csdn.net/m0_64881386/article/details/123880862
Author: love2study
Title: 神经网络的入门

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/762010/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

python列表怎么更新_追加时Python列表更新元素

我有一个python列表，我想在其中附加一个列表。名单是这样宣布的：data = [] 然后我在列表中附加： ^{pr2}$ 之后，我想附加另一个列表：[0, 0, 0, 0, 0…

Python 2023年9月23日
0048
python给一列数据增加前缀_为Datafram的特定列添加前缀

如果col1和col2是第一和第二列名，则最简单的解决方案是：df.columns = df.columns[:2].union(df.columns[2:] + ‘_…

Python 2023年8月8日
0032
Cannot find reference ‘xxx‘ in __init__.py/ No module named db_utils

分析了一下有人说是Python版本的问题还有的是pycharm的问题我这次碰到的是，社区版本创建flask项目，在app.py想引入别的py文件时出现了问题有点像idea中jav…

Python 2023年8月10日
0042
【Python】2048——初学者也能写的小游戏

直接上代码 1 import random 2 from tkinter import Frame, Label, CENTER 3 4 5 SIZE = 400 6 GRID_L…

Python 2023年5月24日
0080
python数据可视化-matplotlib入门(7)-从网络加载数据及数据可视化的小总结

除了从文件加载数据外，另一个数据源是互联网，它每天产生各种不同的数据，可以以多种方式从互联网加载数据。 [En] In addition to loading data from …

Python 2023年5月24日
0058
matplotlib 文字标注（text、annotate）例程

1、效果 ; 2、代码 import matplotlib.pyplot as plt import numpy as np x = np.linspace(-1,1,50) y1…

Python 2023年9月3日
0041
FastAPI（八十四）实战开发《在线课程学习系统》–接口测试

我们在之前讲了单元测试，这次我们分享下一部分接口的接口测试。那么我们看来看下对应的接口怎么测试。那么我们去设计对应的登陆用例，由于接口我们之前开发过，我们参照之前的接口开发的代…

Python 2023年6月15日
0060
如何使用熵值法分组计算核心指标权重，并为项目打分

在实际工作中，需要结合数据的特征情况选择权重计算方法。我在B端项目分析中更多考虑的是数据所携带的信息量，故选择了熵值法。本次权重计算的不同之处在于，项目具有较强的行业属性，须按照行…

Python 2023年8月20日
0069
Django笔记-Django自定义用户验证实现用户登录

自定义编写一个认证后端步骤 1.在users子应用下新建py文件utils.py,定义一个类为AuthPasswordUsernameModelBackend继承django.co…

Python 2023年8月5日
0033
flask 使用sqlalchemy连接postgreSQL，长期无活动，出现异常断开的解决方案

后端长时间无数据库请求后，第一次恢复请求会报错，错误信息是这样的： sqlalchemy.exc:OperationalError: (psycopg2.OperationalEr…

Python 2023年8月13日
0050
Pytorch中使用TensorBoard

本文记录了如何在Pytorch中使用Tensorboard（主要是为了备忘） ; Pytorch中使用TensorBoard 虽然我本身就会用TensorBoard，但是因为Ten…

Python 2023年8月1日
0063
python飞机大战教学_python实现飞机大战

此文实例给亲们分享了python实现飞机大战的具体代码，供大家参考，具体内容如下实现的效果如下：主程序代码如下： import pygame from plane_sprite…

Python 2023年9月23日
0031
学习笔记——Django项目中的请求与响应

2022-10-01 ALLOWED_HOSTS “ALLOWED_HOSTS”的含义：它是指允许放在”ALLOWED_HOSTS&#8221…

Python 2023年10月31日
0035
Python | Pandas | 不完全总结

本文对 Pandas 的使用进行不完全总结 1。 Updated: 2023 / 08 / 05 Python | Pandas | 不完全总结数据类型 * 信息查询类型转换 …

Python 2023年8月7日
0050
python逐段读取docx文件中的图片(高中信息技术题库系统）

最近做了一个”浙江省高中信息技术高考题库系统”，后台用django框架，前端vue.js。其中有个功能模块就是把练习题目docx格式，批量导入数据库。具体做…

Python 2023年8月3日
0059
Python 创建一个空的DataFrame，并按行写入数据

方法1 import pandas as pd df = pd.DataFrame(columns = [‘A’,’B’,’C’,’D’]) for i in range(4): …

Python 2023年8月7日
0034

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

神经网络的入门

神经网络的介绍

神经网络的架构

大家都在看