全站最详细的Python numpy 搭建全连接神经网络模型教程（理论计算+代码实现）（不止能预测手写数字数据，准确率93.21%）

2023年6月15日下午10:28 • 人工智能 • 阅读 113

全站最详细的Python numpy 搭建全连接神经网络模型教程（理论计算+代码实现）（不止能预测手写数字数据，准确率93.21%）

1.引言

本文构建的全连接神经网络模型结构图如上。其中中间隐藏层的数量以及各层（输入层、隐藏层、输出层）的神经单元数量均可自由设置，本文构造的神经网络并不是专门为识别手写数字而写死的，而是可以根据任务的需要，自由改变神经网络的参数（如层数、神经单元数、学习率、学习率衰减值等）。在本文里以识别手写数字为例，输出层的神经单元数为 9，结构图为了能够表示得更清晰（使其看起来不混乱），遂只绘制了 3 个神经单元。

本文已将神经网络模型程序 封装成类，神经网络的各参数为类中属性，神经网络的生成、训练、预测、保存、评估等为类中方法，以便可以更加快捷地调用，同时降低代码冗余、提高代码可读性。

本文作者：A WHU SIM Student

4.6包含6万条手写数据的数据集+本文章构建的全连接神经网络模型+训练好的准确率为93.21%的全连接神经网络模型:全连接神经网络

2.涉及的神经网络知识原理

2.1神经网络思想

人工神经网络（artificial neural network，ANN）是一种模仿生物神经网络的结构和功能的数学模型或计算模型。神经网络由大量的人工神经元联结进行计算。大多数情况下人工神经网络能在外界信息的基础上改变内部结构，是一种自适应系统。现代神经网络是一种非线性统计性数据建模工具，常用来对输入和输出间复杂的关系进行建模，或用来探索数据的模式。

生物神经网络的主要工作原理如下：

①神经元形成网络。

②对于从其他多个神经元传递过来的信号，如果它们的和不超过某个固定大小的值（阈值)，则神经元不做出任何反应。

③对于从其他多个神经元传递过来的信号，如果它们的和超过某个固定大小的值（阈值)，则神经元做出反应（称为点火)，向另外的神经元传递固定强度的信号。

④在②和③中，从多个神经元传递过来的信号之和中，每个信号对应的权重不一样。

将神经元的工作在数学上抽象化，并以其为单位人工地形成网络，这样的人工网络就是神经网络。将构成大脑的神经元的集合体抽象为数学模型，这就是神经网络的出发点。

单个人工神经单元结构如下图：

多个神经单元组成的神经网络如下图：

2.2激活函数

激活函数对于ANN学习和理解真正复杂的东西很重要。它们的主要目的是将ANN中节点的输入信号转换为输出信号，此输出信号将作为下一层的输入。常用激活函数有：单位阶跃激活函数、Sigmoid激活函数、tanh双曲正切激活函数、ReLU整流线性单元激活函数、softmax激活函数。本文使用的是sigmoid（中间层使用）和softmax激活函数（输出层使用）。

2.2.1sigmoid激活函数

Sigmoid函数是一个有着优美S形曲线的数学函数，在逻辑回归、人工神经网络中有着广泛的应用。

公式：

导数：

图像：

优点：平滑、易于求导。

缺点：激活函数计算量大（在正向传播和反向传播中都包含幂运算和除法）；Sigmoid导数取值范围是[0, 0.25]，由于神经网络反向传播时的”链式反应”，很容易就会出现梯度消失的情况。例如对于一个10层的网络，根据 0.25^10 ≈ 0.000000954，第10层的误差相对第一层卷积的参数 W1 的梯度将是一个非常小的值，这就是所谓的”梯度消失”；Sigmoid的输出不是0均值（即zero-centered）；这会导致后一层的神经元将得到上一层输出的非0均值的信号作为输入，随着网络的加深，会改变数据的原始分布。

2.2.2softmax激活函数

softmax用于多分类过程中，它将多个神经元的输出，映射到（0,1）区间内，可以看成概率来理解，从而来进行多分类，其多用于神经网络的最后一次层。

公式：

导数：

当i=j时：

当i != j时：

优点：softmax 是用于多类分类问题的激活函数，在多类分类问题中，超过两个类标签则需要类成员关系。对于长度为 K 的任意实向量，softmax 可以将其压缩为长度为 K，值在（0，1）范围内，并且向量中元素的总和为 1 的实向量。

缺点：在零点不可微，负输入的梯度为零，这意味着对于该区域的激活，权重不会在反向传播期间更新，因此会产生永不激活的死亡神经元。

2.3交叉熵损失

交叉熵是信息论中的概念，最初用于估算平均编码长度。给定两个概率分布p和q，通过q来表示p的交叉熵为：

交叉熵损失（Cross-entropy cost）是用来衡量深度神经网络（DNN）预测的概率分布与实际概率分布的差异的一种方式。它刻画的是实际输出（概率）与期望输出（概率）的距离，即交叉熵损失的值越小，两个概率分布就越接近。与平方损失相比，它能更有效地促进训练全连接神经网络。若𝒚𝒊为标签值， 𝑦𝑖′为预值测，则交叉熵损失为：

2.4小批量梯度下降法

梯度下降法基于的思想是：要找到某函数的最小值，最好的方法是沿着该函数的梯度方向的反方向探寻。如果梯度记为 ∇，则函数 f(x,y)的梯度由下式表示：

这个梯度意味着要沿 x 的方向移动 -∂ f ( x，y ) /∂ x，沿 y 的方向移动- ∂ f ( x ，y )/ ∂ y。其中，函数 f(x,y)必须要在待计算的点上有定义并且可微。梯度下降算法到达每个点后都会重新估计移动的方向。从 P0 开始，计算完该点的梯度，函数就根据梯度移动到下一点 P1。在 P1 点，梯度再次被重新计算，并沿新的梯度方向移动到 P2。如此循环迭代，直到满足条件。迭代的过程中，梯度算子总是保证我们能选取到最佳的移动方向。偏导数确定了移动的方向，再由学习率α确定移动步长，用向量来表示的话，梯度下降算法的迭代公式如下：

小批量梯度下降（Mini-Batch Gradient Descent），是对全批量梯度下降以及随机梯度下降的一个折中办法。其思想是：每次迭代使用多个小批量的样本来对参数进行更新，每个小批量中含有”batchSize”个样本。其优点是每次使用一个小批量样本可以大大减小参数收敛所需要的迭代次数，同时可以使收敛到的结果更加接近梯度下降的效果。在一定范围内，一般来说”batchSize”越大，其确定的下降方向越准，引起训练震荡越小。

2.5误差反向传播法

误差反向传播算法（back propagation，简称BP模型）是1986年由Rumelhart和McClelland为首的科学家提出的概念，是一种按照误差逆向传播来训练多层前馈神经网络的算法。其系统的解决了多层神经网络隐含层连接权学习问题，人们把采用这种算法进行误差校正的多层前馈网络称为BP网。在实验过程中将会给出反向传播计算的详细过程。

2.6手写数字数据集

手写数字数据格式有两种形式：

①MNIST数据集，是由0到9的数字图像构成。其中训练图像有6万张，测试图像有1万张，手写数字由250个不同的人手写而成。每一张图片都有对应的标签数字，图像像素均为2828。图像并不以图像文件形式存储，而是由2828的数组表示，数组中的每个元素与每个像素相对应，通过matplotlib可以将数组表示的图像显示出来。用于训练与分类时，需要将2828的数组转换成1784的向量。

②另一个数字数据集是以文本形式保存的，每一个数字保存在一个txt文本中，数字通过只包含0与1的32*32的数组表示，如数字”4″的表示如下图：

本文使用的数据集为①中数据集。

2.7Python面向对象编程

面向对象（英文是Object Oriented，缩写为OO）面向对象是一种软件开发方法，一种编程方式。通常情况下，我们把对象分为两个部分：静态部分和动态部分。其中静态部分我们称为”属性”，任何的对象都有自己的属性，是客观存在的，如人的性别高矮胖瘦等属性；动态部分是指对象的行为，如人的走路，吃饭，睡觉等可以执行的动作行为。在Python中，类是封装对象的属性和行为的载体。封装是面向对象编程的核心思想，将对象的属性和行为封装起来，而讲对象的属性和行为封装起来的载体就是类。封装就是隐藏对象的属性和实现细节，仅对外公开接口，控制在程序中属性的读和修改的访问级别，将抽象得到的数据和行为(或功能)相结合，形成一个有机的整体，也就是将数据与操作数据的源代码进行有机的结合，形成”类”，其中数据和函数都是类的成员。

本文将神经网络封装成类，神经网络的各参数为类中属性，神经网络的生成、训练、预测、保存、评估等为类中方法，以便可以更加快捷地调用，同时降低代码冗余、提高代码可读性。

3.详细计算推导

3.1各符号解释

3.2前向传播部分

3.3小批量梯度下降部分

3.4误差反向传播部分

4.代码实现

4.2用到的第三方库有：

import copy
import math
import numpy as np
from matplotlib import pyplot as plt
import pandas as pd
import prettytable as pt # 用于绘制表格
import pickle # 用于保存类实例

4.3模型包含的属性与方法部分代码如下：

class DNN:
    def __init__(self):  #&#x521D;&#x59CB;&#x5316;&#x6A21;&#x578B;
        self.a = {}    # &#x7528;&#x4E8E;&#x5B58;&#x653E;&#x5404;&#x5C42;&#x5404;&#x795E;&#x7ECF;&#x5355;&#x5143;&#x8F93;&#x51FA;&#x7684;&#x5B57;&#x5178;
        self.z = {}    # &#x7528;&#x4E8E;&#x5B58;&#x653E;&#x5404;&#x5C42;&#x5404;&#x795E;&#x7ECF;&#x5355;&#x5143;&#x8F93;&#x5165;&#x7684;&#x5B57;&#x5178;
        self.w = {}    # &#x7528;&#x4E8E;&#x5B58;&#x653E;&#x5404;&#x5C42;&#x4E4B;&#x95F4;w&#x53C2;&#x6570;&#x7684;&#x5B57;&#x5178;
        self.b = {}    # &#x7528;&#x4E8E;&#x5B58;&#x653E;&#x5404;&#x5C42;&#x5404;&#x795E;&#x7ECF;&#x5355;&#x5143;&#x504F;&#x7F6E;&#x7684;&#x5B57;&#x5178;
        self.sigma = {}  # &#x7528;&#x4E8E;&#x5B58;&#x653E;&#x53CD;&#x5411;&#x4F20;&#x64AD;&#x65F6;&#x5404;&#x5C42;&#x5404;&#x795E;&#x7ECF;&#x5355;&#x5143;sigma&#x503C;&#x7684;&#x5B57;&#x5178;

        self.hiddenLayersNum = None  # &#x7528;&#x4E8E;&#x8BB0;&#x5F55;&#x9690;&#x85CF;&#x5C42;&#x5C42;&#x6570;&#xFF0C;&#x4FBF;&#x4E8E;&#x8BA1;&#x7B97;&#x51FA;&#x8F93;&#x51FA;&#x5C42;&#x7684;&#x7D22;&#x5F15;
        # self.y = None  # &#x7528;&#x4E8E;&#x4FDD;&#x5B58;&#x7ECF;&#x8FC7;softmax&#x51FD;&#x6570;&#x6FC0;&#x6D3B;&#x540E;&#x7684;&#x8F93;&#x51FA;&#x7684;numpy&#x5217;&#x5411;&#x91CF;

        self.lr = 0.01  # &#x8BBE;&#x7F6E;&#x521D;&#x59CB;&#x5B66;&#x4E60;&#x7387;&#xFF0C;&#x9ED8;&#x8BA4;&#x503C;&#x4E3A;0.01
        self.decay = 0  # &#x8BBE;&#x7F6E;&#x6BCF;&#x8F6E;&#x8FED;&#x4EE3;&#x5B66;&#x4E60;&#x7387;&#x8870;&#x51CF;&#x503C;&#xFF0C;&#x9ED8;&#x8BA4;&#x4E3A;0

        self.wDeriv = {}  # &#x8BB0;&#x5F55; Li &#x5BF9; w &#x7684;&#x504F;&#x5BFC;&#x7684;&#x7D2F;&#x52A0;&#x548C;
        self.bDeriv = {}  # &#x8BB0;&#x5F55; Li &#x5BF9; b &#x7684;&#x504F;&#x5BFC;&#x7684;&#x7D2F;&#x52A0;&#x548C;

        self.parameterRecord = {} # &#x7528;&#x4E8E;&#x8BB0;&#x5F55;&#x67D0;&#x4E9B;&#x6307;&#x5B9A;&#x53C2;&#x6570;&#x5728;&#x6BCF;&#x8F6E;&#x8FED;&#x4EE3;&#x540E;&#x7684;&#x503C;&#xFF0C;&#x4FBF;&#x4E8E;&#x7ED8;&#x5236;&#x53C2;&#x6570;&#x6536;&#x655B;&#x66F2;&#x7EBF;

        self.y_Matrix = None  # &#x5F85;&#x9884;&#x6D4B;&#x7684;&#x6837;&#x672C;&#x7684;&#x7C7B;&#x522B;&#x77E9;&#x9635;
        self.y_predict_Matrix = []  # &#x7528;&#x4E8E;&#x4FDD;&#x5B58;&#x6A21;&#x578B;&#x9884;&#x6D4B;&#x7ED3;&#x679C;&#x7684;&#x77E9;&#x9635;

        self.y_DataFrame = None
        self.y_predict_DataFrame = None

        # &#x6DFB;&#x52A0;&#x8F93;&#x5165;&#x5C42;&#x7684;&#x65B9;&#x6CD5;&#xFF0C;&#x53C2;&#x6570;layer&#x4E3A;&#x5217;&#x8868;&#xFF0C;&#x5176;&#x5217;&#x8868;&#x5143;&#x7D20;&#x53EA;&#x6709;&#x4E00;&#x4E2A;&#xFF0C;&#x7528;&#x4E8E;&#x6307;&#x5B9A;&#x8F93;&#x5165;&#x5C42;&#x7684;&#x795E;&#x7ECF;&#x5355;&#x5143;&#x4E2A;&#x6570;
    def addInputLayer(self, layer):

        # &#x6DFB;&#x52A0;&#x9690;&#x85CF;&#x5C42;&#x7684;&#x65B9;&#x6CD5;&#xFF0C;&#x53C2;&#x6570;layer&#x4E3A;&#x5217;&#x8868;&#xFF0C;&#x5176;&#x5217;&#x8868;&#x5143;&#x7D20;&#x4E2A;&#x6570;&#x4EE3;&#x8868;&#x6DFB;&#x52A0;&#x7684;&#x9690;&#x85CF;&#x5C42;&#x5C42;&#x6570;&#xFF0C;&#x6BCF;&#x4E00;&#x4E2A;&#x5143;&#x7D20;&#x6307;&#x5B9A;&#x5176;&#x5BF9;&#x5E94;&#x7684;&#x9690;&#x85CF;&#x5C42;&#x6240;&#x542B;&#x7684;&#x795E;&#x7ECF;&#x5355;&#x5143;&#x4E2A;&#x6570;
    def addHiddenLayer(self, layer):

        # &#x6DFB;&#x52A0;&#x8F93;&#x51FA;&#x5C42;&#xFF0C;&#x53C2;&#x6570;layer&#x4E3A;&#x5217;&#x8868;&#xFF0C;&#x5176;&#x5143;&#x7D20;&#x53EA;&#x6709;&#x4E00;&#x4E2A;&#xFF0C;&#x4EE3;&#x8868;&#x8F93;&#x51FA;&#x5C42;&#x795E;&#x7ECF;&#x5355;&#x5143;&#x4E2A;&#x6570;&#xFF08;&#x5373;&#x5206;&#x7C7B;&#x7C7B;&#x522B;&#x4E2A;&#x6570;&#xFF09;
    def addOutputLayer(self, layer):

    # &#x7528;&#x4E8E;&#x67E5;&#x770B;&#x5404;&#x5C42;&#x8BE6;&#x60C5;
    def summary(self):

        # sigmoid&#x51FD;&#x6570;&#xFF0C;&#x8F93;&#x5165;&#x5217;&#x5411;&#x91CF;&#xFF0C;&#x8FD4;&#x56DE;&#x8BA1;&#x7B97;&#x540E;&#x7684;&#x5217;&#x5411;&#x91CF;
    def sigmoid(self, vector):

        # softmax&#x6FC0;&#x6D3B;&#x51FD;&#x6570;&#xFF0C;&#x8F93;&#x5165;&#x5217;&#x5411;&#x91CF;&#xFF0C;&#x8FD4;&#x56DE;&#x8BA1;&#x7B97;&#x540E;&#x7684;&#x5217;&#x5411;&#x91CF;
    def softmax(self, vector):

        # &#x524D;&#x5411;&#x4F20;&#x64AD;&#xFF0C;&#x53C2;&#x6570; X_vector &#x4E3A;&#x67D0;&#x6837;&#x672C;&#x7279;&#x5F81;&#x5411;&#x91CF;&#xFF0C;&#x8FD4;&#x56DE; y_predict_vector &#x8BE5;&#x6837;&#x672C;&#x9884;&#x6D4B;&#x7C7B;&#x522B;&#x5411;&#x91CF;
    def forwardPropagation(self, X_vector):

        # &#x8BA1;&#x7B97;&#x591A;&#x5206;&#x7C7B;&#x4EA4;&#x53C9;&#x71B5;&#x635F;&#x5931;
    def categoricalCrossentropyLoss(self, y_vector,y_predict_vector):

        # &#x53CD;&#x5411;&#x4F20;&#x64AD;, &#x53C2;&#x6570;&#x4E3A;&#x8BE5;&#x6837;&#x672C;&#x771F;&#x5B9E;&#x7C7B;&#x522B;&#x6807;&#x7B7E; y_vector.shape = (1, 10) &#xFF0C;&#x7528;&#x4E8E;&#x8BA1;&#x7B97;&#x8F93;&#x51FA;&#x5C42;&#x7684;sigma&#x503C;
    def backPropagation(self, y_vector):

    def judge(self, y_vector, y_predict_vector):

    # &#x6A21;&#x578B;&#x8BAD;&#x7EC3;
    '''
    &#x53C2;&#x6570; X_Matrix &#x4E3A;&#x8BAD;&#x7EC3;&#x6837;&#x672C;&#x7279;&#x5F81;&#x503C;&#x77E9;&#x9635;&#xFF08;&#x6BCF;&#x4E00;&#x884C;&#x4E3A;&#x4E00;&#x4E2A;&#x6837;&#x672C;&#xFF09;
    y_Matrix&#x4E3A;&#x8BAD;&#x7EC3;&#x6837;&#x672C;&#x7C7B;&#x522B;&#x6807;&#x7B7E;&#x77E9;&#x9635;&#xFF08;&#x6BCF;&#x4E00;&#x884C;&#x4E3A;&#x4E00;&#x4E2A;&#x6837;&#x672C;&#xFF09;
    epochs&#x4E3A;&#x8FED;&#x4EE3;&#x8F6E;&#x6570;&#xFF08;&#x9ED8;&#x8BA4;&#x4E3A;20&#x8F6E;&#xFF09;
    batchSize&#x4E3A;&#x4F7F;&#x7528;&#x5C0F;&#x6279;&#x91CF;&#x68AF;&#x5EA6;&#x4E0B;&#x964D;&#x7B97;&#x6CD5;&#x65F6;&#x6BCF;&#x4E2A;&#x5C0F;&#x6279;&#x91CF;&#x7684;&#x6837;&#x672C;&#x6570;&#x76EE;
    parameterList &#x63CF;&#x8FF0;&#x9700;&#x8981;&#x8BB0;&#x5F55;&#x7684;&#x53C2;&#x6570;&#xFF0C;&#x5982;[("w",2,4,3), ("b", 2, 1)] &#x8868;&#x793A;&#x9700;&#x8981;&#x8BB0;&#x5F55; &#x7B2C;1&#x5C42;&#x7B2C;3&#x4E2A;&#x795E;&#x7ECF;&#x5143;&#x5230;&#x7B2C;2&#x5C42;&#x7B2C;4&#x4E2A;&#x795E;&#x7ECF;&#x5143;&#x7684;&#x6743;&#x91CD;w &#x548C; &#x7B2C;2&#x5C42;&#x7B2C;1&#x4E2A;&#x795E;&#x7ECF;&#x5143;&#x7684;&#x504F;&#x7F6E;b
    '''
    # &#xFF0C;&#xFF0C;epochs&#x4E3A;&#x8FED;&#x4EE3;&#x8F6E;&#x6570;&#xFF08;&#x9ED8;&#x8BA4;&#x4E3A;20&#x8F6E;&#xFF09;&#xFF0C;
    def fit(self, X_Matrix, y_Matrix, epochs=20, batchSize=30, parameterList = None):

    # &#x6839;&#x636E;self.parameterRecord&#x7ED8;&#x5236;&#x53C2;&#x6570;&#x6536;&#x655B;&#x66F2;&#x7EBF;&#x7684;&#x51FD;&#x6570;
    def drawConvergenceCurve(self):

    # &#x6A21;&#x578B;&#x9884;&#x6D4B;
    def predict(self, X_Matrix):

    # &#x6A21;&#x578B;&#x8BC4;&#x4F30;
    def modelEvaluate(self, y_Matrix):
        # &#x521D;&#x59CB;&#x5316;&#x4EA4;&#x53C9;&#x71B5;&#x635F;&#x5931;
        L = 0.0
        # &#x521D;&#x59CB;&#x5316;&#x51C6;&#x786E;&#x7387;
        accuracy = 0

    # &#x4FDD;&#x5B58;&#x6A21;&#x578B;  &#x5B9E;&#x4F8B;&#x65B9;&#x6CD5;
    def saveModel(self, modelFileUrl):
        f = open(modelFileUrl, 'wb')

    @classmethod # &#x7C7B;&#x65B9;&#x6CD5;&#xFF0C;&#x7528;&#x4E8E;&#x8C03;&#x7528;&#x6A21;&#x578B;
    def importModel(cls, modelFileUrl):
        f = open(modelFileUrl, 'rb')

    # &#x7ED8;&#x5236;&#x624B;&#x5199;&#x6570;&#x5B57;
    def drawDigits(self, X_vector, y_vector):
        plt.imshow(X_vector.reshape(28, 28))  # cmap="gray"

    @classmethod # &#x7C7B;&#x65B9;&#x6CD5;&#xFF0C;&#x7528;&#x4E8E;&#x8F6C;&#x6362;&#x6570;&#x636E;&#x683C;&#x5F0F;&#xFF0C;&#x8F93;&#x5165;&#x7684;&#x662F;pandas&#x6570;&#x7EC4;&#xFF0C;&#x8FD4;&#x56DE;numpy&#x77E9;&#x9635;&#xFF0C;&#x4EE5;&#x4FBF;&#x4E8E;&#x795E;&#x7ECF;&#x7F51;&#x7EDC;&#x7684;&#x8BA1;&#x7B97;
    def dataFormatConversion(cls, X_DataFrame,y_DataFrame, classNum):
        # &#x5C06;y_DataFrame&#x7531;&#x5217;&#x5411;&#x91CF;&#x8F6C;&#x4E3A;&#x884C;&#x5411;&#x91CF;&#xFF0C;

4.4模型功能：

1.任意设置输入层、隐藏层、输出层中各层的神经单元个数；

2.任意设置隐藏层层数；任意设置学习率、学习率衰减值，从而满足不同的学习率衰减策略；

3.任意设置迭代轮数；

4.任意设置小批量中的样本数；

5.能够根据给定的数组还原手写数字图像；

6.能够绘制指定参数的迭代收敛曲线。

7.能够保存训练好的模型（保存在txt文件中），这样就可以只训练一次，下次要用时直接调用训练好的模型，而不需要再次训练。

经过一天的等待，最终模型对2万个训练数据的预测准确率为0.9321，交叉熵损失为1.5233。

模型绘制的数据集中的第一个数字”5″：

Original: https://blog.csdn.net/qq_52181283/article/details/124555765
Author: 同稚君
Title: 全站最详细的Python numpy 搭建全连接神经网络模型教程（理论计算+代码实现）（不止能预测手写数字数据，准确率93.21%）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/617934/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【Linux】CUDA Toolkit和cuDNN版本对应关系（更新至2022年6月，附官网永久更新链接）

目录一、前言二、对应关系三、如何使用四、总结五、参考一、前言 NVIDIA® CUDA® Toolkit 为创建高性能 GPU 加速应用程序提供了一个开发环境。借助 C…

人工智能 2023年5月23日
0088
python easydict模块的使用

python easydict模块的使用edict 一、easydict简介 easydict的作用和其名字一样，让你更easy地使用dict，一句话来概括，easydict允许…

人工智能 2023年7月12日
0056
分类之决策树分类

基本概念树状结构，可以很好的对数据进行分类决策树的根节点到叶节点的每一条路径构建一条规则具有互斥且完备的特点，即每一个样本均被且只能被一条路径所覆盖只要提供的数据量足…

人工智能 2023年7月3日
0081
python DataFrame数据分组统计groupby()函数

groupby()函数在python的DataFrame中对数据进行分组统计主要使用groupby()函数。 ʚʕ̯•͡˔•̯᷅ʔɞ 个人简介🍹 欢迎各路大佬来到小啾主页指点☀️…

人工智能 2023年6月11日
0088
Pandas高级教程之:Dataframe的重排和旋转

文章目录简介使用Pivot 使用Stack 使用melt 使用Pivot tables 使用crosstab get_dummies 简介使用Pandas的pivot方法可以…

人工智能 2023年7月8日
0072
知识图谱论文中模型指标MRR，MR，HITS@1，HITS@3，HITS@10的含义

知识图谱论文中模型指标MRR，MR，HITS@1，HITS@3，HITS@10的含义本文将介绍用于衡量知识图谱嵌入（Knowledge Graph Embedding，KGE）模…

人工智能 2023年6月1日
0073
为什么CUDA装好了，Tensorflow-GPU不能用？

原因 * – 1.CUDA、cudnn、Tensorflow、python版本并不配套！！！（大多都是这个原因） – 2.CUDA没有装好： –…

人工智能 2023年5月25日
0076
人工智能领域也卷了吗——YOLO系列又被刷新了，YOLOv7横空出世

前段时间刚更新了文章，介绍了YOLOV5系列以及代码实现过程，突然间V6,V7版本相继发布，让爱技术的小伙伴吗一时不知所措，需要学习的东西还有很多，真是活到老，学到老。 ——1——…

人工智能 2023年7月9日
0057
目标检测学习-ASFF

1.研究背景在绝大多数目标检测网络中，如下图Fig1特征金字塔（Feature Pyramid Network，FPN）是一个不可缺少的部分，FPN网络主要解决的问题是目标检测在…

人工智能 2023年7月12日
0064
论文阅读：Question Answering Over Temporal Knowledge Graphs

论文阅读：Question Answering Over Temporal Knowledge Graphs 我们首先在我们的新数据集上应用大型预训练的基于 LM 的 QA 方法。…

人工智能 2023年5月28日
0073
为什么Adam 不是默认的优化算法?

由于训练时间短，越来越多人使用自适应梯度方法来训练他们的模型，例如Adam它已经成为许多深度学习框架的默认的优化算法。尽管训练结果优越，但Adam和其他自适应优化方法与随机梯度下降…

人工智能 2023年7月14日
0063
Input_shape参数

在Keras中以LSTM层时作为输入层时，需要输入input_shape参数表明输入的形状。 input_shape=(n_steps,n_features) n_steps是时间…

人工智能 2023年6月16日
0063
14:30面试，14:38就出来了，问的实在是太…

从外包出来，没想到算法死在另一家厂子，自从加入这家公司，每天都在加班，钱倒是给的不少，所以也就忍了。没想到8月一纸通知，所有人不许加班，薪资直降30%，顿时有吃不起饭的赶脚。好在…

人工智能 2023年7月30日
0050
基于python实现TF-IDF算法

标签：2021.09.27工作内容参考资料：TF-IDF算法介绍及实现声明：本文中大量内容转载至参考资料，仅归纳整理和加入部分个人观点心得，侵删概念定义 TF-IDF(term…

人工智能 2023年7月16日
0048
【AI框架】MMDetection3D 目标检测框架的 Docker 环境制作和改良

MMDetection3D 是一个基于 PyTorch 的目标检测开源工具箱, 下一代面向3D检测的平台. ✨本文提供了一套完整的基于Docker的目标检测研究环境搭建思路，对官…

人工智能 2023年7月12日
00131
JETSON NANO 2G 安装 TensorFlow 2.6 & Jupyter Server

1.格式化SD卡（大于等于32G） 2.balenaEtcher-Setup-1.7.0.exe 写卡 3.连接HDMI ，进行初始设置（选择语言，时区，用户名，密码，登录方式…

人工智能 2023年5月25日
0071

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

全站最详细的Python numpy 搭建全连接神经网络模型教程（理论计算+代码实现）（不止能预测手写数字数据，准确率93.21%）

2.1神经网络思想

2.2激活函数

2.2.1sigmoid激活函数

2.2.2softmax激活函数

2.3交叉熵损失

2.4小批量梯度下降法

2.5误差反向传播法

2.6手写数字数据集

2.7Python面向对象编程

3.1各符号解释

3.2前向传播部分

3.3小批量梯度下降部分

3.4误差反向传播部分

4.2用到的第三方库有：

4.3模型包含的属性与方法部分代码如下：

4.4模型功能：

大家都在看