实验——神经网络预测Fashion-MNIST数据集

2023年7月14日上午7:45 • 人工智能 • 阅读 71

文章目录

一实验数据
二实验要求
三实验思路与代码
*
3.1 初始的设想
3.2 改进思路：矩阵运算
四实验结果分析
参考：

一实验数据

Fashion-MNIST数据集，数据集中包含 60000 张训练样本，10000 张测试样本，可将训练样本划分为49000 张样本的训练集和1000 张样本的验证集，测试集可只取1000 张测试样本。其中每个样本都是 28×28 像素的灰度照片，每个像素点包括RGB三个数值，数值范围0 ~ 255，所有照片分属10个不同的类别。

灰度与像素值的关系：

图像的灰度化：灰度就是没有色彩，RGB色彩分量全部相等。图像的灰度化就是让像素点矩阵中的每一个像素点都满足关系：R=G=B，此时的这个值叫做灰度值。如RGB(100,100,100)就代表灰度值为100,RGB(50,50,50)代表灰度值为50。
灰度值与像素值的关系：如果对于一张本身就是灰度图像（8位灰度图像）来说，他的像素值就是它的灰度值，如果是一张彩色图像，则它的灰度值需要经过函数映射来得到。灰度图像是由纯黑和纯白来过渡得到的，在黑色中加入白色就得到灰色，纯黑和纯白按不同的比例来混合就得到不同的灰度值。R=G=B=255为白色，R=G=B=0为黑色，R=G=B=小于255的某个整数时，此时就为某个灰度值。

; 二实验要求

用神经网络对给定的数据集进行分类，画出loss图，给出在测试集上的精确度；
不能使用 pytorch 等框架，也不能使用库函数，所有算法都要自己实现
整个神经网络包括 3 层——输入层，隐藏层，输出层。输入层有28x28x3个神经元，隐藏层有 50个神经元，输出层有 10 个神经元（对应 10 个类别）。
附加：可以试着修改隐藏层神经元数，层数，学习率，正则化权重等参数探究参数对实验结果的影响

三实验思路与代码

实验要求设计一个三层的全连接神经网络，实现分类的功能。 实验原理请见我的博客：神经网络基础与反向传播_Sunburst7的博客-CSDN博客

神经网络的每次迭代主要包括以下几个步骤：

传入训练图片灰度矩阵/数组
进行前馈运算，计算出输出层10个神经元预测的标签
与期望的标签计算Loss，更新隐含层（Hidden）到输出层（Output）的权值
计算 隐含层的敏感度，更新输入层（Input）到隐含层的权值
传入测试图片灰度矩阵，进行预测。
统计

起初我的设计充满了面向对象的思想，导致在进行大数据集的运算时消耗时间很长，无法训练神经网络，受到参考【2】【3】【4】中博客的启发，改变思路，采用矩阵运算的思想成功训练出一个良好的神经网络。

3.1 初始的设想

我准备编写一个神经元类表示单个神经元，该神经元有以下属性，手绘原理图：

权值数组Weights：上一层与该神经元相连的所有神经元的权值
偏置Bias
输入值数组Inputs与输出值Output
激活函数
敏感度：定义可见实验原理博客
神经元类型Type：标识是输入层还是输出层还是隐含层神经元

每个神经元有两个函数，分别代表前馈与反向传播。

前馈：将输入值与权值进行向量的内积，加上偏置，在传入激活函数，输出最后的值
反向传播：对于输入层与输出层不同，利用传入的敏感度数组与权值数组更新自身的权值矩阵。

import numpy as np

def sigmoid(x):
    if x>=0:
        return 1.0/(1+np.exp(-x))
    else:
        return np.exp(x)/(1+np.exp(x))

class Neuron:
    def __init__(self, weights, bias, ntype):

        self.weights = weights

        self.bias = bias

        self.inputs = 0

        self.output = 0

        self.sensitivity = 0.0

        self.ntype = ntype

    def __str__(self):
        return "weights: \n"+str(self.weights)+"\nbias:\n"+str(self.bias)+"\ninputs:\n"+str(self.inputs)+"\noutput:\n"+str(self.output)+"\nsensitivity\n"+str(self.sensitivity)+"\ntype:\n"+str(self.ntype)

    def feedForward(self, inputs:np.array):
"""
        前馈
        :param inputs: 输入的向量
        :return:
"""
        self.inputs = inputs

        total = np.dot(self.weights, self.inputs) + self.bias

        if self.ntype == 'Input':
            self.output = total
        else:
            self.output = sigmoid(total)
        return self.output

    def backPropagation(self ,eta ,tk ,sensitivities ,weights):
"""
        反向传递更新权值
        :param eta: 学习率
        :param tk: 真实标签
        :param sensitivities: 该神经元如果不是输出层，隐含层下一层所有神经元的敏感度
        :param weights: 该神经元如果不是输出层，与该神经元相连的下一层的所有权值
        :return:
"""
        if self.ntype == 'Output':

            derivative_f = self.output*(1-self.output)

            derivative_loss = -(tk - self.output)

            self.sensitivity = -derivative_f*derivative_loss

            self.weights = self.weights + eta*self.sensitivity*np.array(self.inputs)
        elif self.ntype == 'Hidden':

            derivative_f = self.output * (1 - self.output)

            self.sensitivity = derivative_f*np.dot(sensitivities,weights)

            self.weights = self.weights + eta*self.sensitivity*np.array(self.inputs)
        else:
            return

再编写一个神经网络类构造三层神经元并进行feedForward与backPropagation的参数传递工作：

import numpy as np
import os
import gzip
from exp4.Neuron1 import Neuron

def sigmoid(x):
    if x>=0:
        return 1.0/(1+np.exp(-x))
    else:
        return np.exp(x)/(1+np.exp(x))

def load_data(data_folder):
  files = [
      'train-labels-idx1-ubyte.gz', 'train-images-idx3-ubyte.gz',
      't10k-labels-idx1-ubyte.gz', 't10k-images-idx3-ubyte.gz'
  ]
  paths = []
  for fname in files:
    paths.append(os.path.join(data_folder,fname))
  with gzip.open(paths[0], 'rb') as lbpath:
    y_train = np.frombuffer(lbpath.read(), np.uint8, offset=8)
  with gzip.open(paths[1], 'rb') as imgpath:
    x_train = np.frombuffer(
        imgpath.read(), np.uint8, offset=16).reshape(len(y_train), 28, 28)
  with gzip.open(paths[2], 'rb') as lbpath:
    y_test = np.frombuffer(lbpath.read(), np.uint8, offset=8)
  with gzip.open(paths[3], 'rb') as imgpath:
    x_test = np.frombuffer(
        imgpath.read(), np.uint8, offset=16).reshape(len(y_test), 28, 28)
  return (x_train, y_train), (x_test, y_test)

def makeTrueLabels(trueLabel):
"""
    生成传递给输出层的期望标签数组
    :param trueLabel:
    :return:
"""
    labels = []
    for i in range(10):
        if trueLabel == i:
            labels.append(1)
        else:
            labels.append(0)
    return labels

class NeuronNetwork:
    def __init__(self,train_images,train_labels,test_images,test_labels):
        self.inputLayer = []
        self.hiddenLayer = []
        self.outputLayer = []
        self.train_images = train_images
        self.train_labels = train_labels
        self.test_images = test_images
        self.test_labels = test_labels

        initWeight_1 = np.random.uniform(-1/np.sqrt(784),1/np.sqrt(784),(50,784))

        initWeight_2 = np.random.uniform(-1/np.sqrt(50),1/np.sqrt(50),(10,50))

        bias = np.random.normal(0,0.5,2)

        for i in range(784):
            neuron = Neuron(1,0,ntype='Input')
            self.inputLayer.append(neuron)

        for i in range(50):
            neuron = Neuron(initWeight_1[i],bias[0],ntype='Hidden')
            self.hiddenLayer.append(neuron)

        for i in range(10):
            neuron = Neuron(initWeight_2[i],bias[1],ntype='Output')
            self.outputLayer.append(neuron)

    def iteration(self):
        T = 0
        N = 0

        for m in range(self.train_images.shape[0]):

            y_i = []

            for row in range(self.train_images.shape[1]):
                for col in range(self.train_images.shape[2]):
                    y_i.append(
                        self.inputLayer[28 * row + col].feedForward(inputs=np.array(train_images[m][row][col]))
                    )

            y_h = []
            for hidden_neuron in self.hiddenLayer:
                y_h.append(hidden_neuron.feedForward(y_i))

            y_o = []
            for output_neuron in self.outputLayer:
                y_o.append(output_neuron.feedForward(y_h))

            forecastLabel = y_o.index(np.array(y_o).max())
            if forecastLabel == train_labels[m]:
                T+=1
            else:
                N+=1

            trueLabels = makeTrueLabels(trueLabel=forecastLabel)

            output_sensitivities = []
            output_weights = []
            for i in range(10):
                self.outputLayer[i].backPropagation(eta=0.1,tk=trueLabels[i],sensitivities=None,weights=None)

                output_sensitivities.append(self.outputLayer[i].sensitivity)
                output_weights.append(self.outputLayer[i].weights)

            for i in range(50):

                linkedWeights = [arr[i] for arr in output_weights]
                self.hiddenLayer[i].backPropagation(eta=0.1,tk=None,sensitivities=output_sensitivities,weights=linkedWeights)

        return T, N

(train_images, train_labels), (test_images, test_labels) = load_data('')
train_images = train_images[0:500:1]
train_labels = train_labels[0:500:1]
"""
    定义统计信息：

"""
n = 100
positive = []
negative = []
nn = NeuronNetwork(train_images=train_images,train_labels=train_labels,test_images=test_images,test_labels=test_labels)
for k in range(100):
    T,N = nn.iteration()
    positive.append(T)
    negative.append(N)

该神经网络只能运行在少量的样本上，不能满足需要

3.2 改进思路：矩阵运算

之前思路中更新的过程太慢，每次都要一张一张图片传入，同时大量的对象也拖慢了运算的速度，因此我取消了神经元类，而在神经网络中保存两个矩阵，分别代表从输入层到隐含层与从隐含层到输出层的权值。

神经网络类通过输入层节点数、隐含层节点数、输出层节点数、学习率进行初始化，同时初始化两个权值矩阵以及一个偏置数组。


class NeuralNetwork:
    def __init__(self,inputNeurons,hiddenNeurons,outputNeurons,lr):
"""
        神经网络构造方法
        :param inputNeurons:输入层神经元个数
        :param hiddenNeurons:隐含层神经元个数
        :param outputNeurons:输出层神经元个数
        :param lr:学习率
"""
        self.iNeuron_num = inputNeurons
        self.hNeuron_num = hiddenNeurons
        self.oNeuron_num = outputNeurons
        self.learnRate = lr
        self.f = lambda x: ssp.expit(x)

        self.weights_i_h = np.random.normal(0.0, 1/np.sqrt(hiddenNeurons), (self.hNeuron_num, self.iNeuron_num))
        self.weights_h_o = np.random.normal(0.0, 1/np.sqrt(hiddenNeurons), (self.oNeuron_num, self.hNeuron_num))

        self.bias = np.random.normal(0, 0.5, 2)

对输入的图片与标签进行 两步处理：

归一化
对于图片将所有的灰度(0-255)全部映射到(0.01-0.99)上
对于每一个表示分类结果的标签(0-9)重新构造一个长度为10的数组，下标对应每个标签，若真实分类标签为8，则数组[7] = 0.99，其他位置的值为0.01，近似表示该图片真实标签的概率。


for i in range(60000):

    img = train_images[i].reshape(train_images.shape[1]*train_images.shape[2])

    train_matrix[:,i] = (img/255.0)*0.99+0.01

    train_labels_matrix[train_labels[i],i] = 0.99

for i in range(10000):

    test_img = test_images[i].reshape(test_images.shape[1] * test_images.shape[2])

    test_matrix[:,i] = (test_img/255.0)*0.99+0.01

    test_label_matrix[test_labels[i],i] = 0.99

整个前馈的矩阵运算的过程如图：

BP的过程主要分为两个部分：

对于输出层到隐含层：

&#x8BA1;&#x7B97;f'(net) = f(net)*(1-f(net))
&#x8BA1;&#x7B97;loss'(zk)=-(tk-zk)
&#x8BA1;&#x7B97;&#x5BF9;&#x4E8E;&#x6BCF;&#x5F20;&#x56FE;&#x7247;&#x8BE5;&#x795E;&#x7ECF;&#x5143;&#x7684;&#x654F;&#x611F;&#x5EA6;(10,60000):
sensitivity = -f'(output_f_net)*loss'(zk) = (tk-zk)*f(output_f_net)*(1-f(output_f_net))[&#x77E9;&#x9635;&#x5BF9;&#x5E94;&#x4F4D;&#x7F6E;&#x76F8;&#x4E58;]
&#x66F4;&#x65B0;&#x6743;&#x91CD;:&#x5B66;&#x4E60;&#x7387;*&#x654F;&#x611F;&#x5EA6;(10,60000) @ 50&#x4E2A;&#x9690;&#x542B;&#x5C42;&#x5C42;&#x795E;&#x7ECF;&#x5143;&#x7684;&#x8F93;&#x51FA;(60000,50)

对于隐含层到输入层：

&#x8BA1;&#x7B97;&#x5BF9;&#x4E8E;&#x6BCF;&#x5F20;&#x56FE;&#x7247;50&#x4E2A;&#x9690;&#x542B;&#x5C42;&#x795E;&#x7ECF;&#x5143;&#x7684;&#x6BCF;&#x4E00;&#x4E2A;&#x795E;&#x7ECF;&#x5143;&#x7684;&#x4ECE;&#x8F93;&#x51FA;&#x5C42;&#x4F20;&#x5165;&#x7684;&#x654F;&#x611F;&#x5EA6;&#xFF08;50*60000)&#xFF1A;
&#x8F93;&#x51FA;&#x5C42;&#x654F;&#x611F;&#x5EA6;&#x7684;&#x52A0;&#x6743;&#x548C;*f'(net)
&#x66F4;&#x65B0;&#x6743;&#x91CD;

完整的训练过程如下：

    def train(self,featuresMatrix,targetMatrix,iterateNum):
"""
        神经网络一次训练
        :param featuresMatrix: 784*60000的图片灰度矩阵 也是隐含层的输入
        :param targetMatrix: 10*60000的期望值矩阵 tk
        :param iterateNum: 迭代序号
        :return: 返回训练正确率
"""
        T = 0
        N = 0

        hidden_net = (self.weights_i_h @ featuresMatrix)+self.bias[0]

        hidden_f_net = self.f(hidden_net)

        output_net = (self.weights_h_o @ hidden_f_net)+self.bias[1]

        output_f_net = self.f(output_net)

        for imgIndex in range(60000):

            if output_f_net[:,imgIndex].argmax() == targetMatrix[:,imgIndex].argmax():
                T+=1
            else:
                N+=1
        print("第"+iterateNum+"次训练集迭代正确率："+str(T/60000))

        output_errors = targetMatrix - output_f_net

        sensitivities = output_errors * output_f_net * (1.0 - output_f_net)

        self.weights_h_o += self.learnRate * (sensitivities @ hidden_f_net.T)

        hidden_sensitivities = (self.weights_h_o.T @ sensitivities) * hidden_f_net * (1 - hidden_f_net)

        self.weights_i_h += self.learnRate * ( hidden_sensitivities @ featuresMatrix.T)

        return T/60000

预测的过程就是进行一遍前馈的过程：

    def test(self,testMatrix,targetMatrix,iterateNum):
"""
        利用神经网络对训练集进行一次测试
        :param testMatrix: 784*10000的灰度矩阵
        :param targetMatrix: 10*10000的预测标签矩阵
        :param iterateNum: 迭代序号
        :return: 返回训练正确率
"""
        T = 0
        N = 0

        hidden_net = (self.weights_i_h @ testMatrix) + self.bias[0]

        hidden_f_net = self.f(hidden_net)

        output_net = (self.weights_h_o @ hidden_f_net) + self.bias[1]

        output_f_net = self.f(output_net)

        for imgIndex in range(10000):

            if output_f_net[:, imgIndex].argmax() == targetMatrix[:, imgIndex].argmax():
                T += 1
            else:
                N += 1
        print("第" + iterateNum + "次测试集迭代正确率：" + str(T / 10000))
        return T / 10000

调试与结果展示代码如下：


(train_images, train_labels), (test_images, test_labels) = load_data('')

train_matrix = np.zeros((784,60000))
test_matrix = np.zeros((784,10000))

train_labels_matrix = np.zeros((10,60000))+0.01
test_label_matrix = np.zeros((10,10000))+0.01

for i in range(60000):

    img = train_images[i].reshape(train_images.shape[1]*train_images.shape[2])

    train_matrix[:,i] = (img/255.0)*0.99+0.01

    train_labels_matrix[train_labels[i],i] = 0.99

for i in range(10000):

    test_img = test_images[i].reshape(test_images.shape[1] * test_images.shape[2])

    test_matrix[:,i] = (test_img/255.0)*0.99+0.01

    test_label_matrix[test_labels[i],i] = 0.99

learn_rate = 0.000025

epochs = 100

nn = NeuralNetwork(784,50,10,learn_rate)

train_accuracy = []
test_accuracy = []

for i in range(epochs):
    train_accuracy.append( nn.train(train_matrix,train_labels_matrix,str(i)) )
    test_accuracy.append( nn.test(test_matrix,test_label_matrix,str(i)) )

plt.plot(range(1,epochs+1),train_accuracy,'y')
plt.plot(range(1,epochs+1),test_accuracy,'g')
plt.legend(labels = ('train accuracy', 'test accuracy'), loc = 'lower right')
plt.title("learn rate: "+str(learn_rate))
plt.xlabel('iteration')
plt.ylabel('accuracy')
plt.show()

四实验结果分析

当学习率为0.1时，由于学习率过大导致更新的权重过大使得权重数组全为负值，继而在之后的迭代中计算激活能时是一个极大的复数，带入sigmod函数趋近于0，从而导致权值不再更新，正确率维持在0.1更新。

解决的方法是 降低学习率，不让权值更新的过快，将学习率降低为0.000025时，迭代50次，整个模型有很大的优化：

提高迭代次数至200次，预测正确率可以达到75%左右：

; 参考：

【1】神经网络基础与反向传播_Sunburst7的博客-CSDN博客

【2】识别MNIST数据集之（二）：用Python实现神经网络_superCally的专栏-CSDN博客

【3】用python创建的神经网络–mnist手写数字识别率达到98%_学习机器学习-CSDN博客_mnist手写数字识别python

【4】利用Python对MNIST手写数据集进行数字识别（初学者入门级）_仲子_real-CSDN博客_mnist手写数字识别python

Original: https://blog.csdn.net/qq_45785407/article/details/121594352
Author: Sunburst7
Title: 实验——神经网络预测Fashion-MNIST数据集

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/691607/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

hive修复所有表

众所周知 hive是hive ，hdfs是hdfs，mysql是mysql。但是某种意义上来说hive=hdfs(数据文件)+mysql(元数据)。所以要牵扯到一个msck r…

人工智能 2023年6月28日
0065
图文并茂：什么是 K-means 聚类算法

概述聚类属于机器学习的无监督学习，在数据中发现数据对象之间的关系，将数据进行分组，组内的相似性越大，组间的差别越大，则聚类效果越好。它跟分类的最主要区别就在于有没有&#8221…

人工智能 2023年6月19日
0092
YOLO-v3论文详解

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年7月12日
0049
第3章数据分析工具Pandas

本章使用的包： import numpy as np import pandas as pd 一，Pandas的数据结构分析Pandas的数据结构分析： 1，Pandas 中有两个…

人工智能 2023年7月8日
0068
Python CT图像预处理——nii格式读取、重采样、窗宽窗位设置

文章目录 nii格式CT数据读取 * 读写nii格式文件查看重采样窗宽窗位设置 * 方法一：手动设置窗宽窗位方法二： nii格式CT数据读取遇到nii格式的CT数据，可以…

人工智能 2023年6月17日
0096
学习pytorch中归一化transforms.Normalize

常用的数据预处理方法，提升泛化能力。包括：数据中心化、数据标准化、缩放、裁剪、旋转、填充、噪声添加、灰度变换、线性变换、放射变换、亮度、饱和度和对比度变换等数据标准化——tran…

人工智能 2023年5月28日
0090
Auto MPG 汽车油耗预测（tensorflow深度学习龙书笔记）

利用全连接网络模型来完成汽车的效能指标 MPG(Mile Per Gallon，每加仑燃油英里数)的预测问题实战数据集我们采用 Auto MPG 数据集，它记录了各种汽车效能指…

人工智能 2023年5月25日
00102
Logistic算法中的正则化方法包括L1正则化和L2正则化，用于解决模型过拟合问题

问题背景在机器学习中，经常会出现模型过拟合的问题。过拟合是指模型在训练集上表现良好，但在新数据集上表现较差的现象。为了解决这个问题，在Logistic算法中引入了正则化方法，其中…

人工智能 2023年12月31日
0033
基于PaddleOCR的DBNet多分类文本检测网络

目录目的模型网络结构对比代码实现 1、数据集格式 2、配置文件调整 3、数据预处理 4、模型代码调整 5、添加多分类loss 6、修改db_postprocess.py 7、…

人工智能 2023年6月30日
0066
Transformer 中的mask

简单聊聊transformer里的mask —— 转载自链接一 1.padding mask 在encoder和decoder两个模块里都有padding mask，位置是在sof…

人工智能 2023年6月24日
00133
雷达成像 Matlab 仿真 3 —— 多目标检测

文章目录 1. 多目标信号的回波 * 1.1 参数设置 1.2 生成回波信号 2. 脉冲压缩 * 2.1 未加窗 2.2 加 hann 窗 3. 绘制图像脉冲压缩能够将信号压缩变…

人工智能 2023年6月17日
0092
动手学深度学习——数据操作之ndarray与tensor间的转换

无论使用哪个深度学习框架，它的张量类（在MXNet中为 ndarray，在PyTorch和TensorFlow中为 tensor）都与Numpy的ndarray类似。但深度学习…

人工智能 2023年7月6日
0086
文本结构化

信息抽取之文本结构化浅谈如何快速制作一个专业领域的文本结构化工具，可用于非规则自然文本的关键信息快速抽取前言—电子病历文本结构化电子病历的文本结构化是指我们从电子病历的自然语…

人工智能 2023年5月28日
0077
安装CPU版本的pytorch

题外话：有些同学的笔记本电脑可能没有显卡或者显卡不太好，建议安装CPU版本的pytorch。这类同学如果实在需要使用GPU加速训练过程，建议使用在线GPU。打开Anaconda P…

人工智能 2023年7月21日
0050
MySQL进阶语句

目录引言一、常用查询 1.1、order by按关键字排序多字段排序 1.2、and/or判断 and/or使用 1.3、distinct查询不重复记录 1.4、GROUP …

人工智能 2023年6月2日
0086
【python 目标检测】基于深度学习的道路破损检测|yolov5|VOC

前不久从大数据局那里接到了一个任务，让我们做一个道路破损的目标检测，上网搜了一搜，发现资料并不是很多。 torch 1.11.0torchvision 0.12.0python 3…

人工智能 2023年7月27日
0078

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

实验——神经网络预测Fashion-MNIST数据集

文章目录

3.1 初始的设想

3.2 改进思路：矩阵运算

大家都在看