【Python 初学者】从零开始构建自己的神经网络

2023年7月31日下午8:57 • Python • 阅读 62

此图为使用神经网络预测猫狗案例。
原创：CSDN/知乎：川川菜鸟

文章目录

*
– 什么是神经网络？
– 训练神经网络
– 前向传播
– 损失函数
– 反向传播
– 完整应用
– 提问
– 结束语

; 什么是神经网络？

大多数神经网络的介绍性文本在描述它们时都会提出大脑类比。在不深入研究大脑类比的情况下，我发现将神经网络简单地描述为将给定输入映射到所需输出的数学函数会更容易。

神经网络由以下组件组成

输入层x
任意数量的 隐藏层
一个 输出层，ŷ
每层W 和 b之间的一组权重和偏差
每个隐藏层的激活函数选择 σ。在本教程中，我们将使用 Sigmoid 激活函数。

下图显示了 2 层神经网络的架构（请注意，在计算神经网络中的层数时，输入层通常被排除在外）

在 Python 中创建神经网络类很容易

class NeuralNetwork:
    def __init__(self, x, y):
        self.input      = x
        self.weights1   = np.random.rand(self.input.shape[1],4)
        self.weights2   = np.random.rand(4,1)
        self.y          = y
        self.output     = np.zeros(y.shape)

训练神经网络

一个简单的 2 层神经网络的输出ŷ是：

可能会注意到，在上面的等式中，权重W和偏差b是影响输出ŷ 的唯一变量。自然地，权重和偏差的正确值决定了预测的强度。从输入数据微调权重和偏差的过程称为训练神经网络。

训练过程的每次迭代包括以下步骤：

计算预测输出ŷ，称为前馈
更新权重和偏差，称为反向传播

下面的时序图说明了这个过程

; 前向传播

正如我们在上面的时序图中看到的，前馈只是简单的微积分，对于一个基本的 2 层神经网络，神经网络的输出是：

让我们在我们的 python 代码中添加一个前馈函数来做到这一点。请注意，为简单起见，我们假设偏差为 0。

class NeuralNetwork:
    def __init__(self, x, y):
        self.input      = x
        self.weights1   = np.random.rand(self.input.shape[1],4)
        self.weights2   = np.random.rand(4,1)
        self.y          = y
        self.output     = np.zeros(self.y.shape)
   # 前向反馈
    def feedforward(self):
        self.layer1 = sigmoid(np.dot(self.input, self.weights1))
        self.output = sigmoid(np.dot(self.layer1, self.weights2))

然而，我们仍然需要一种方法来评估我们预测的”优度”，损失函数使我们能够做到这一点。

损失函数

有许多可用的损失函数，我们问题的性质应该决定我们选择的损失函数。在本教程中，我们将使用一个简单的平方和误差作为我们的损失函数。

也就是说，平方和误差只是每个预测值与实际值之间的差值之和。差异被平方，以便我们测量差异的绝对值。

我们在训练中的目标是找到最小化损失函数的最佳权重和偏差集。

; 反向传播

现在我们已经测量了预测的误差（损失），我们需要找到一种方法将误差传播回去，并更新我们的权重和偏差。

为了知道调整权重和偏差的适当数量，我们需要知道 损失函数相对于权重和偏差的导数。 回想一下微积分，函数的导数就是函数的斜率。

如果我们有导数，我们可以简单地通过增加/减少它来更新权重和偏差（参见上图）。这被称为 梯度下降。

但是，我们不能直接计算损失函数对权重和偏差的导数，因为损失函数的方程不包含权重和偏差。因此，我们需要链式法则来帮助我们计算它。（计算损失函数相对于权重的导数的链式法则。请注意，为简单起见，我们仅显示了假定 1 层神经网络的偏导数。）

可以看出损失函数相对于权重的导数（斜率），这样我们就可以相应地调整权重。现在我们已经有了，让我们将反向传播函数添加到我们的 python 代码中。

class NeuralNetwork:
    def __init__(self, x, y):
        self.input      = x
        self.weights1   = np.random.rand(self.input.shape[1],4)
        self.weights2   = np.random.rand(4,1)
        self.y          = y
        self.output     = np.zeros(self.y.shape)

    def feedforward(self):
        self.layer1 = sigmoid(np.dot(self.input, self.weights1))
        self.output = sigmoid(np.dot(self.layer1, self.weights2))

    def backprop(self):
        # application of the chain rule to find derivative of the loss function with respect to weights2 and weights1
        d_weights2 = np.dot(self.layer1.T, (2*(self.y - self.output) * sigmoid_derivative(self.output)))
        d_weights1 = np.dot(self.input.T,  (np.dot(2*(self.y - self.output) * sigmoid_derivative(self.output), self.weights2.T) * sigmoid_derivative(self.layer1)))

        # 用损失函数的导数（斜率）更新权重
        self.weights1 += d_weights1
        self.weights2 += d_weights2

完整应用

完整代码：

coding=gbk
"""
作者：川川
@时间  : 2022/11/23 15:36
"""
import numpy as np
import matplotlib.pyplot as plt

激活函数
def sigmoid(x):
    return 1.0 / (1 + np.exp(-x))

#
def sigmoid_derivative(x):
    return x * (1.0 - x)

计算损失函数
def compute_loss(y_hat, y):
    return ((y_hat - y)**2).sum()

class NeuralNetwork:
    def __init__(self, x, y):
        self.input = x
        # 它为每个输入创建 4 个介于 0 和 1 之间的随机数
        self.weights1 = np.random.rand(self.input.shape[1], 4)
        self.weights2 = np.random.rand(4, 1)
        self.y = y
        self.output = np.zeros(self.y.shape)

    def feedforward(self):
        self.layer1 = sigmoid(np.dot(self.input, self.weights1))
        self.output = sigmoid(np.dot(self.layer1, self.weights2))

    def backprop(self):
        # application of the chain rule to find derivative of the loss function with respect to weights2 and weights1
        d_weights2 = np.dot(self.layer1.T, (2 * (self.y - self.output) * sigmoid_derivative(self.output)))
        d_weights1 = np.dot(self.input.T, (np.dot(2 * (self.y - self.output) * sigmoid_derivative(self.output),
                                                  self.weights2.T) * sigmoid_derivative(self.layer1)))

        # update the weights with the derivative (slope) of the loss function
        self.weights1 += d_weights1
        self.weights2 += d_weights2

if __name__ == "__main__":
    X = np.array([[0, 0, 1],
                  [0, 1, 1],
                  [1, 0, 1],
                  [1, 1, 1]])
    y = np.array([[0], [1], [1], [0]])
    nn = NeuralNetwork(X, y)

    loss_values = [] # 记录loss列表
    for i in range(1500):
        nn.feedforward()
        nn.backprop()
        loss = compute_loss(nn.output, y) # 计算loss
        loss_values.append(loss)

print(nn.output) # 输出
print(f" final loss : {loss}") # 最终loss
plt.plot(loss_values) # 可视化loss变化
plt.show()

现在我们已经有了用于执行前馈和反向传播的完整 python 代码，让我们将我们的神经网络应用到一个示例中，看看它的效果如何。（对应上面代码）

让我们对神经网络进行 1500 次迭代训练，看看会发生什么。查看下面的每次迭代损失图，我们可以清楚地看到损失单调递减到最小值。这与我们之前讨论的梯度下降算法是一致的。

让我们看看 1500 次迭代后神经网络的最终预测（输出）

我们的前馈和反向传播算法成功地训练了神经网络，并且预测收敛于真实值。请注意，预测值与实际值之间存在细微差异。这是可取的，因为它可以防止过度拟合并允许神经网络更好地泛化到看不见的数据。

提问

除了 Sigmoid 函数，我们还可以使用什么激活函数？
如何训练神经网络时使用学习率？
如何使用卷积进行图像分类任务？

结束语

从头开始编写自己的神经网络学到了很多东西。尽管 TensorFlow 和 Keras 等深度学习库可以在不完全了解神经网络内部工作原理的情况下轻松构建深度网络，但我发现更深入地了解神经网络是很有用的。

Original: https://blog.csdn.net/weixin_46211269/article/details/128000545
Author: 川川菜鸟
Title: 【Python 初学者】从零开始构建自己的神经网络

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/726605/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

面对面教你用Python查看茅台股票交易数据

Original: https://www.cnblogs.com/123456feng/p/16056732.htmlAuthor: 蚂蚁ailingTitle: 面对面教你用P…

Python 2023年11月9日
0033
10的负8次方用python_matplotlib；10的分数次幂；科学记数法

我处理模拟数据，最近经常使用matplotlib，遇到了一些问题(bug？)真烦人。在我一直允许matplotlib自动设置记号标签和它们的类型(科学的，等等)，在一些数据中我得…

Python 2023年9月5日
0039
运行的第一个Django

2022-09-24 创建了一个Django项目后，进行测试，输入指令： python manage.py runserver 出现了如下问题：我还想着，Django模块通过安装…

Python 2023年10月31日
0031
计算机视觉OpenCv学习系列：第八部分、图像操作-4

第八部分、图像操作-4 * – 第一节、图像卷积操作 – + 1.图像卷积定义 + 2.卷积函数 + 3.代码练习与测试 – 第二节、高斯模糊 …

Python 2023年11月5日
0039
群集搭建【LNMP+负载均衡+高可用+跳板机】

目录项目需求LNMP部署web1部署mysql部署php部署nfs部署LNMP测试负载均衡与高可用web2部署lb1部署lb2部署验证群集跳板机功能测试跳板机项目需求实验目标：…

Python 2023年11月7日
0037
conda创建虚拟环境并添加到jupyter kernel（踩坑泪目）

一些命令 conda list 查看安装了那些包 conda env list 查看有哪些虚拟环境 conda update conda 检查更新当前conda conda ins…

Python 2023年9月8日
0043
分布式爬虫Scrapy-Redis之四种组件及原理

分布式爬虫分布式爬虫是由一组通过网络进行通信、为了完成共同的爬虫任务而协调工作的计算机节点组成的系统。分布式爬虫是将多台电脑组合起来，共同完成一个爬虫任务，大大提高爬取效率。 …

Python 2023年10月4日
0056
MySQL高级SQL语句

目录一、常用查询 1、按关键字排序 1.1 前期准备 1.2 升序、降序列出数据 1.3 找出其中南京的数据并以分数降序列出 1.4 查询学生信息先按兴趣id降序排列，相同分数的…

Python 2023年9月26日
0056
在python中安装gensim包（为了使用LDA）

LDA是英文”Latent Dirichlet Allocation”的缩写，意思是隐含狄利克雷分布，是一种主题模型（topic model），它可以将 …

Python 2023年8月28日
0040
pycharm安装教程，超详细

python学习资料下载地址：python学习资料整理在安装pycharm之前，确保你的电脑配置好了python，没有下载安装的可以去看我的文章—>>>pytho…

Python 2023年11月8日
0065
用python刷算法–快速排序算法

快速排序算法流程选定一个基准值(任意选,以第一个为例) 定义左右指针指向左右两端左指针往右移动,如果遇到大于基准值的数就把它和右指针的值调换位置,然后左指针不动,右指针开始向左…

Python 2023年6月3日
0069
Python条件语句和循环语句简单使用方法

1.Python条件语句 Python条件语句是通过一条或多条语句的执行结果（True或者False）来决定执行的代码块。可以通过下图来简单了解条件语句的执行过程:Python程…

Python 2023年10月30日
0030
Python matplotlib入门级绘制图形(二)–利用统计基础函数绘制简单的图形

目录绘制统计图形 plt.bar()–绘制柱状图 plt.pie()–绘制饼图 plt.hist()–绘制直方图 plt.scatter()&…

Python 2023年9月1日
0068
Linux 安装Nginx

版本区别常用版本分为四大阵营 Nginx开源版 http://nginx.org/ Nginx plus 商业版 https://www.nginx.com openresty …

Python 2023年6月12日
0063
记录Android Jni编译过程

Gradle配置我们主要看这个配置文件里面吧，这里面有关于ndk配置的选项。大概介绍一下，这里面一些字段是干嘛的。我们看，这里面有两个相仿的字段，都是externalNativ…

Python 2023年9月28日
0036
VSCODE设置conda环境自动加载

文章目录 CONDA环境在VSCODE自动加载 CONDA环境在VSCODE自动加载 1、添加环境变量打开电脑属性，在path添加conda安装路径的目录：比如：C:\Users\…

Python 2023年9月9日
0031

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30