python和numpy纯手写BP神经神经网络

2023年8月25日下午3:00 • Python • 阅读 38

这里写目录标题

python和numpy纯手写BP神经神经网络
*
二级目录
–
- 三级目录
神经网络的基本理解
神经网络公式
–
神经网络python代码

python和numpy纯手写BP神经神经网络

二级目录

三级目录

神经网络的基本理解

神经网络分为三层，输入层，隐含层以及输出层。隐含层可以为多层神经网络。输入层为输入样本的数据维度（N*D），输出层为样本标签y，y可以为离散值（分类任务）也可以为连续值（回归任务）。

个人理解，神经网络的训练过程主要有四个步骤，包括：
（1）正向传播：通过多层线性网络结构（w_1,w_2,…w_n），将输入样本进行特征信息提取，降低原始数据的维度。
（2）激活函数：将每层网络线性求解的结果，进行非线性变换，实现特征信息的非线性转换。常见的激活函数：simgoid函数，relu函数，tanh函数等。
（3）误差求解：将模型求出的预测值，与真实值进行误差求解，得到模型预测值与真实值之间的差异，用于后续的反向传播。
（4）反向传播。根据误差值，调整模型参数w，使得模型的预测值接近于模型的真实值。

神经网络的主要原理就是通过不断调整模型参数，使得模型的预测值接近于真实值。

神经网络公式

神经网络结构如上图所示，下图是上图的公式理解，模型参数的设定，关键在于层层神经元的个数，也就是说上层的输入维度需与下一层的输入维度相同。
例：输入样本X为N个样本，3维特征，X-[N,3]，第一层隐含层的w_1-[3,d]，d为经过第一层网络后，对原始数据进行升维或者降维（特征提取），设w_1-[3,4],b_1-[1,4]，进过第一层网络得到z_1,z_1-[N,4],通过激活函数，得到h_1,h_1便是第一层网络对原始数据特征提取后得到的结果。

; 前向传播

第一层网络公式如下（输入层→第一层隐含层）：

第二层网络公式如下（第一层隐含层→第二层隐含层）：

第三层网络公式如下（第二层隐含层→输出层）：

最后输出的是h3，（N，10），N是样本个数,10是类别种类个数。

激活函数

前向传播中的f()就是激活函数

误差求解

计算模型输出值与真实值之间的误差。误差一般都是经过绝对值或者平方的数，以得的一个始终大于0得的数，以无限接近于0，作为预测精准度。本文以一个L2-LOSS为例：

; 反向传播

反向传播是神经网络中的关键一步，如何将误差层层方向传递到各个网络层中的w是关键。求解dw_out,dw_2.dw_1.

（1）求解dw_out;

通过链式法则，将复合函数进行分解进行逐步求导。

h2-(5,N)

注意：1. 这里用的激活函数是sigmoid函数，不同的激活函数，在该项中求得的结果是不一样的；2. h3矩阵与（1-h3）矩阵相乘，而不是点乘，这里是对矩阵中的每个元素进行求导，因此出来的结果是 逐元素相乘。在求导过程中，有的是点乘，有的是相乘。

h2是输出层的输入值，(h3-y) (h3(1-h3))可以看做误差，所以dwout其实就是等于输入的转置点乘误差。（计算的时候，先计算误差，误差中的乘法运算是相乘。）

求解db_out;

db_out的输入只是单位矩阵I，其实就是将误差的所有行相加。
db就是误差的求和。

需要改变的梯度方向，其实就是输入的转置·误差

（2）求解dw_2;

将上一层的误差error_1通过上一层的参数w进行传递，并再乘以该层的激活函数的求导，便是这一层的误差。
这里w的转置，是为了与前面的维度相匹配，其实求导出来的是w还是w的转置，这个是根据分子布局还是分母分局来确定的，w和w的装置在这里其实是一样的，只是元素排列的方式不同。（个人理解）

（3）求解dw_1;

参数更新

求出dw，db只是说明在某点参数w，b下降最快的方向，并不能确定下降多少距离。因此引入一个学习率a，用于表示下降的距离。学习率a不能过大，因为过大的话，有可能下降距离过大，导致错过最小极值点。

w_out=w_out-a _dw_out
b_out=b_out-a_db_out
w_2=w_2-a _dw_2
b_2=b_2-a_db_2
w_1=w_1-a _dw_1
b_1=b_1-a_db_1

dw只是个变化方向，通过a来赋予距离，在于原始的w进行向量的加减，便可以达到新w在某一方向变化的距离。

神经网络python代码

初始化模型参数w，b。利用np.random.randn随机生成0-1之间的数

def __init__(self,input_size,label_size):
        np.random.seed(6)
        self.w_1=np.random.randn(input_size,4)
        self.b_1=np.random.randn(1,4)
        self.w_2=np.random.randn(4,5)
        self.b_2=np.random.randn(1,5)
        self.w_out=np.random.randn(5,label_size)
        self.b_out=np.random.randn(1,label_size)

定义前向传播

def feed_forward(self,x):
        z_1=np.dot(x,self.w_1)+self.b_1
        h_1=self.relu(z_1)

        z_2=np.dot(h_1,self.w_2)+self.b_2
        h_2=self.sigmoid(z_2)

        z_3=np.dot(h_2,self.w_out)+self.b_out
        h_3=self.sigmoid(z_3)

        return h_1,h_2,h_3

得到每一层神经网络的输出，并通过激活函数对输出进行非线性转换。

def back(self,x,y):
        h_1,h_2,h_3=self.feed_forward(x)
        error,loss=self.loss_l2(h_3,y)
        error_tans_out=np.multiply(error,self.de_sigmoid(h_3))
        dw_out=np.dot(h_2.T,error_tans_out)
        db_out=np.sum(error_tans_out,axis=0,keepdims=True)

        error_trans_2=np.multiply(np.dot(error_tans_out,w_out.T),self.de_sigmoid(h_2))

        dw_2=np.dot(h_1.T,error_trans_2)
        db_2=np.sum(error_trans_2,axis=0,keepdims=True)

        error_trans_3=np.multiply(np.dot(error_trans_2,w_2.T),self.relu(h_1))
        dw_1=np.dot(x.T,error_trans_3)
        db_1=np.sum(error_trans_3,axis=0,keepdims=True)
        return dw_out,db_out,dw_2,db_2,dw_1,db_1

在反向传播中，一定要搞清楚点乘和叉乘。

参数更新：

def update_weight(self,w_1,b_1,w_2,b_2,w_out,b_out,learn_rate):
        self.w_1=self.w_1-learn_rate*dw_1
        self.b_1=self.b_1-learn_rate*db_1
        self.w_2=self.w_2-learn_rate*dw_2
        self.b_2=self.b_2-learn_rate*db_2
        self.w_out=self.w_out-learn_rate*dw_out
        self.b_out=self.b_out-learn_rate*db_out

损失函数：

 def loss_l2(self,h,y):
        error=h-y
        error_2=0.5*(error*error)
        return error,np.sum(error_2)

激活函数与激活函数的求导

 def relu(self,x):
        z = np.maximum(x, 0)
        return z
    def tanh(self,x):
        return np.tanh(x)
    def sigmoid(self,x):
        ex=np.exp(x)
        return ex/(ex+1)

    def de_relu(self,z,h):
        z[z <= 0] = 0
        z[z > 0] = 1.0
        return z
    def de_sigmoid(self,h):
        return h*(1-h)

训练过程

def train(self,epoch_num,x,y,learning_rate):
        losses=[]
        for i in range(epoch_num):
            h_1,h_2,h_3=self.feed_forward(x)
            error,error_2=self.loss_l2(h_3,y)
            dw_out,db_out,dw_2,db_2,dw_1,db_1=self.back(x,y)
            self.update_weight(dw_1,db_1,dw_2,db_2,dw_out,db_out,learning_rate)
            losses.append(error_2)
            if(i%20==0):
                print("iter:{},loss:{}".format(i,error_2))

        return losses

所有代码：

class BPNN(object):
    def __init__(self,input_size,label_size):
        np.random.seed(6)
        self.w_1=np.random.randn(input_size,10)
        self.b_1=np.random.randn(1,10)
        self.w_2=np.random.randn(10,5)
        self.b_2=np.random.randn(1,5)
        self.w_out=np.random.randn(5,label_size)
        self.b_out=np.random.randn(1,label_size)
    def feed_forward(self,x):
        z_1=np.dot(x,self.w_1)+self.b_1
        h_1=self.relu(z_1)

        z_2=np.dot(h_1,self.w_2)+self.b_2
        h_2=self.sigmoid(z_2)

        z_3=np.dot(h_2,self.w_out)+self.b_out
        h_3=self.sigmoid(z_3)

        return h_1,h_2,h_3

    def back(self,x,y):
        h_1,h_2,h_3=self.feed_forward(x)
        error,loss=self.loss_l2(h_3,y)
        error_tans_out=np.multiply(error,self.de_sigmoid(h_3))
        dw_out=np.dot(h_2.T,error_tans_out)
        db_out=np.sum(error_tans_out,axis=0,keepdims=True)

        error_trans_2=np.multiply(np.dot(error_tans_out,w_out.T),self.de_sigmoid(h_2))

        dw_2=np.dot(h_1.T,error_trans_2)
        db_2=np.sum(error_trans_2,axis=0,keepdims=True)

        error_trans_3=np.multiply(np.dot(error_trans_2,w_2.T),self.relu(h_1))
        dw_1=np.dot(x.T,error_trans_3)
        db_1=np.sum(error_trans_3,axis=0,keepdims=True)
        return dw_out,db_out,dw_2,db_2,dw_1,db_1

    def update_weight(self,w_1,b_1,w_2,b_2,w_out,b_out,learn_rate):
        self.w_1=self.w_1-learn_rate*dw_1
        self.b_1=self.b_1-learn_rate*db_1
        self.w_2=self.w_2-learn_rate*dw_2
        self.b_2=self.b_2-learn_rate*db_2
        self.w_out=self.w_out-learn_rate*dw_out
        self.b_out=self.b_out-learn_rate*db_out

    def loss_l2(self,h,y):
        error=h-y
        error_2=0.5*(error*error)
        return error,np.sum(error_2)

    def relu(self,x):
        z = np.maximum(x, 0)
        return z
    def tanh(self,x):
        return np.tanh(x)
    def sigmoid(self,x):
        ex=np.exp(x)
        return ex/(ex+1)

    def de_relu(self,z,h):
        z[z <= 0] = 0
        z[z > 0] = 1.0
        return z
    def de_sigmoid(self,h):
        return h*(1-h)

    def train(self,epoch_num,x,y,learning_rate):
        losses=[]
        for i in range(epoch_num):
            h_1,h_2,h_3=self.feed_forward(x)
            error,error_2=self.loss_l2(h_3,y)
            dw_out,db_out,dw_2,db_2,dw_1,db_1=self.back(x,y)
            self.update_weight(dw_1,db_1,dw_2,db_2,dw_out,db_out,learning_rate)
            losses.append(error_2)
            if(i%20==0):
                print("iter:{},loss:{}".format(i,error_2))

        return losses

if __name__ == '__main__':
    n_samples=10
    n_feature=5
    x=np.random.randn(n_samples,n_feature)
    y=np.array([1,2,2,3,2,3,1,3,1,3])
    y=y-1
    out_size=len(np.unique(y))
    y_1=np.zeros(shape=(n_samples,out_size))
    for i in range(len(y)):
        y_1[i][y[i]]=1

    epoch_num = 10000
    model=BPNN(5,3)
    losses = model.train(epoch_num=epoch_num,x=x,y=y_1,learning_rate=0.01)

关键点：
参数梯度变化的方向（dw）=输入的转置·误差
误差就是将上一层的误差通过上一层的w进行传递，在叉乘该层激活函数的导数。

参考文献：
王木头学科学：添加链接描述（非常宝藏的up主，通俗易懂的讲解原理）
鲁东大学课件：添加链接描述

python和numpy纯手写3层神经网络，干货满满:

BP神经网络以及在手写数字分类中python代码的详细注释

Original: https://blog.csdn.net/Callmebig/article/details/122919657
Author: 皮皮王波什
Title: python和numpy纯手写BP神经神经网络

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/759428/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Python数据分析|Numpy学习(一)

重要的Python库使用NumPy，可以执行以下操作：多维数组的算数和逻辑运算。基于元素的数组计算或者数组间数学操作函数用于读写硬盘中的基于数组的数据集的工具傅立叶变换和…

Python 2023年8月26日
0054
牛客网OJ终端输入输出

牛客网OJ终端输入输出，自己踩过的坑，有的笔试会限制编程语言。 1、输入输出常用的模块如：os，io，bufio，strings，strconv等。2、有的的oj平台不会给出模块提…

Python 2023年6月16日
0077
Css3入门详解

一、Css基本语法 1.Html和Css没分开点击查看代码 <!DOCTYPE html> <html lang="en"> <…

Python 2023年6月9日
0071
【pytest官方文档】解读fixtures – 9. 什么样的fixture结构，用起来最可靠？

通过之前一系列的解读，相信大家对于fixture已经有了更多的理解。fixture功能强大，我觉得用来处理setup、teardown非常的灵活，好用。但是，毕竟它也只是一段程序…

Python 2023年9月14日
0035
零基础学Python Web开发在线考试系统-Django框架入门项目第1课-请求和响应（真正带你上路玩转实战项目开发）

本文章项目开源地址：https://codechina.csdn.net/csdn-django-web/django_kaoshi_demo 系列文章目录提示：需要下载代码的朋…

Python 2023年8月5日
0067
pickleDB一个轻量级python数据库

pickleDB pickleDB 欢迎快速开始快速安装基础命令打开或者新建一个数据库设置一条数据增加一条数据获取数据删除一个数据删除数据库一些废话欢迎 pi…

Python 2023年6月12日
00119
【Matplotlib】Matplotlib绘图样式索引（含形状、颜色、标签位置）

文章目录 Matplotlib绘图样式 * 1.创建一个（或多个）图表 – 创建一个图表创建多个图表 2. Axis标签位置 3.基本绘图样式 4.线条样式 5.标记…

Python 2023年9月4日
0052
2022深圳杯C题思路解析

题目描述：继续更新再更问题三继续更新第一问、第四问 1.2 问题重述在制定电动车调度方案时，必须考虑充、换电池的时间成本，从而提出了新的车辆运输选址及调度问题。 1）已…

Python 2023年11月7日
0053
python运算符

算术运算符： / % ** // 比较运算符： == != > < >= Original: https://www.cnblogs.com/daxiangcai…

Python 2023年11月3日
0040
谣言检测——(GCAN)《GCAN: Graph-aware Co-Attention Networks for Explainable Fake News Detection on Social Media》

论文标题：GCAN: Graph-aware Co-Attention Networks for Explainable Fake News Detection on Social…

Python 2023年10月21日
0041
【Django+MySQL】拆分详解图书管理系统案例

【Django+MySQL】拆分详解图书管理系统案例在本科期间第二次遇到大作业需要使用Django+MySQL搭建数据库管理系统，这次以实现简单图书管理系统为目标，详细的记录每一…

Python 2023年8月4日
0065
[CG从零开始] 4. pyopengl 绘制一个正方形

在做了 1～3 的基础工作后，我们的开发环境基本 OK 了，我们可以开始尝试利用 pyopengl 来进行绘制了。本文主要有三个部分 1. 利用 glfw 封装窗口类为了显示我们…

Python 2023年10月20日
0046
大学学计算机，做好这几点，毕业拿高薪真不难

Original: https://www.cnblogs.com/zichengPython/p/16710832.htmlAuthor: 爱学习的小刘Title: 大学学计算机…

Python 2023年10月31日
0041
Python—数据分析与可视化编程

目标：掌握numpy模块基本操作；掌握matplotlib模块基础操作；掌握pandas模块基础操作。内容： 1.编写程序，利用pyplot将绘图区域划分成2*1个子绘图区域，…

Python 2023年8月6日
0079
4-7 Matplotlib库箱线图

Matplobilb库数据分析常用图 1. 箱线图简介 2. 绘制箱线图 * 2.1 绘制一个箱线图 2.2 绘制多个箱线图 Matplotlib是一个Python的2D绘图库，通…

Python 2023年9月3日
0060
conda 创建FastAPI运行环境

conda创建环境创建环境激活环境 conda的其他命令设置下载源清华源中科大源 conda恢复默认源 pip临时源 pip设置源其他源安装FastAPI 参考：创…

Python 2023年9月9日
0076

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

python和numpy纯手写BP神经神经网络

这里写目录标题

二级目录

三级目录

神经网络的基本理解

神经网络公式

; 前向传播

激活函数

误差求解

; 反向传播

参数更新

神经网络python代码

大家都在看