Python神经网络识别手写数字-MNIST数据集

2023年7月23日上午2:47 • 人工智能 • 阅读 79

Python神经网络识别手写数字-MNIST数据集

一、手写数字集-MNIST
二、数据预处理
*
输入数据处理
输出数据处理
三、神经网络的结构选择
四、训练网络
*
测试网络
测试正确率的函数
五、完整的训练
*
学习率的调整
训练轮数epoch
改变网络结构
附录代码

一、手写数字集-MNIST

要让计算机能够识别出来图片的内容是一件十分困难的事情，识别人的手写笔记也不简单，它们不像印刷字符那样清晰明确，因此在识别上带来一定的困难。
要想让神经网络达到预期的效果就需要大量数据进行学习。那数据怎么来，不用自己收集，国外已经有人制作了一个手写数据集MNIST。在下面这个网站就可以下载完整的数据集。
下载链接：MNIST数据集
网站提供了两种CSV文件：训练集、测试集。
下图展示了打开后的CSV部分数据。

数据的第一列是标签，也就是实际上图像代表的数字，如’2’。这是我们希望得到的答案。随后的数值，也就是从每一行除了第一个数字以外的数值，代表的每一个像素的灰度值，这个数组的尺寸为28*28。这意味着，标签后面跟随了784个数值。光看数值，我们很难看出这张图片显示的是什么。所以在进行训练之前，我们可以将其转化为图像的形式来确认一下这是手写数字。
利用python打开文件，查看一下数据。

data_file = open("C:/Users/15619/train_file.csv", 'r')
data_list = data_file.readlines()
data_file.close
data_list[0]

最后输出的结果如下：

上图我们可以看到，数据之间用逗号分隔，所有数值大小都处在0-255的范围内。我们接下来会使用下列代码将用逗号分隔的数字转化为数组。

用函数按照逗号为分隔标志，将数据拆分成单个数值。
利用切片忽略掉第一个数值，剩下的数据就是784个像素值，可以转化为28*28=784的数组。
imshow绘制数组
代码如下：

import matplotlib.pyplot
import numpy
%matplotlib inline
all_values = data_list[0].split(',')

image_array = numpy.asfarray(all_values[1:]).reshape((28,28))
matplotlib.pyplot.imshow(image_array, cmap='Greys', interpolation='None')

二、数据预处理

输入数据处理

上一节我们知道了如何获取到现成的数据，然后还通过一小段代码输出了一行数据的可视化图像。这节我们来看看如何将数据喂给神经网络。首先要进行下面的处理：

将0-255的像素值，缩放到0.01-1之间，选择0.01作为最小值是为了避免先前观察到的0值输入最终会认为地造成权重更新失败。
首先将像素值/255得到0-1的数值，然后乘以0.99范围变为0-0.99，接着加上0.01，这样可以将整体数值偏移到0.01-1.0。
实现代码

scaled_input = (numpy.asfarray(all_values[1:])/255.0*0.99)+0.01
print(scaled_input)

输出数据处理

神经网络的输入数据已经准备就绪了，现在，我们来讨论一下输出的数据以及匹配的正确输出答案。我们采用的是simoid激活函数，该函数无法输出负数或这大于1的数值，且无法达到0或者1，因为它们是两个极限值。因此，我们得对目标值进行一定处理。
我们要实现的目标是能够对图像进行分类，然后系统输出10个数值，分别对应10个结果。这意味这我们需要选择10个节点。数值的标签是0-9之间的一个，当答案是1的时候，我们希望的输出是对应’1’的一个节点能够输出尽可能接近1的数值，也就是该节点属于激活状态，而其他的节点尽可能处于抑制状态。
下图展示了输出节点的输出示例。

从第一列看，标签是5，输出第六个节点的数值较大，而其他的数值比较小，接近于零。
而最后一列比较有意思，输出的最大数值对应9，而对应4的数值为中等大小。这说明识别对象比较模糊，使得手写字迹难以辨认。通常来说，我们会选择最大的数值作为最后的答案。
现在，我们需要把标签转化为一个目标数组，用于神经网络的训练。比如标签为”5″的节点，其他节点的数值都应该很小，所以我们希望的输出应该是[0,0,0,0,0,1,0,0,0,0]。但是前面我们知道，输出不可能为0或者1，所以我们需要对0和1分别用0.01和0.99来代替。所以最后我们选用的目标输出是[0.01,0.01,0.01,0.01,0.01,0.99,0.01,0.01,0.01,0.01]。
通过下面的代码来实现上述内容：


outnodes = 10

targets = numpy.zero(outnodes)+ 0.01

tartets[int(all_value[0])] = 0.99

三、神经网络的结构选择

输入节点784：图像尺寸是2828大小，所以选择这个输入节点数。
隐含层节点100：选择100个节点并不是通过什么科学计算的方法得到的。而是，首先我们认为神经网络可以找到输入数据中的特征，而这些特征通常都可以用更为简单的方式来表达，因此隐含层节点选择不会超过输入节点数。而选择数量太少的话，网络能力就会不足。100个节点也不是固定的，选择多少个，最好的办法就是多次实验，然后选择一个合适的数字即可。
输出节点10*:由于分类标签有十种结果，所以选择10个节点。

四、训练网络

综合以上描述后的代码如下，我们通过对一个小样本的数据进行训练，打开包含100条数据的csv文件进行网络训练。

import numpy
import scipy.special
import matplotlib.pyplot
%matplotlib inline

class neuralNetwork():

    def __init__(self, inputnodes, hiddennodes, outputnodes, learningrate):
        self.innodes = inputnodes
        self.hinodes = hiddennodes
        self.outnodes = outputnodes
        self.lr = learningrate

        self.winhi = numpy.random.normal(0.0, pow(self.hinodes, -0.5),      (self.hinodes, self.innodes))

        self.whiout = numpy.random.normal(0.0, pow(self.outnodes, -0.5),(self.outnodes, self.hinodes))

        self.activation_function = lambda x: scipy.special.expit(x)
        pass

    def train(self, inputs_list, targets_list):

        inputs = numpy.array(inputs_list,ndmin=2).T
        targets = numpy.array(targets_list,ndmin=2).T

        hidden_inputs = numpy.dot(self.winhi, inputs)
        hidden_outputs = self.activation_function(hidden_inputs)

        final_inputs = numpy.dot(self.whiout, hidden_outputs)
        final_outputs = self.activation_function(final_inputs)

        output_errors = targets - final_outputs
        hidden_errors = numpy.dot(self.whiout.T, output_errors)

        self.whiout +=self.lr*numpy.dot((output_errors*final_outputs*(1-    final_outputs)), numpy.transpose(hidden_outputs))

        self.winhi +=self.lr*numpy.dot((hidden_errors*hidden_outputs*(1.0-hidden_outputs)), numpy.transpose(inputs))

    def query(self, inputs_list):
        inputs = numpy.array(inputs_list,ndmin=2).T
        hidden_inputs = numpy.dot(self.winhi, inputs)

        hidden_outputs = self.activation_function(hidden_inputs)

        final_outputs = numpy.dot(self.whiout, hidden_outputs)

        final_outputs = self.activation_function(final_outputs)
        return final_outputs

input_nodes = 784
hidden_nodes = 100
output_nodes = 10
learning_rate = 0.3
epochs = 3

n = neuralNetwork(input_nodes, hidden_nodes, output_nodes,learning_rate)

training_data_file = open("C:/Users/15619/train_file.csv", 'r')
training_data_list = training_data_file.readlines()
training_data_file.close()

for e in range(epochs):
    for record in training_data_list:
        all_values = record.split(',')

        inputs = (numpy.asfarray(all_values[1:])/255*0.99)+0.01

        targets = numpy.zeros(output_nodes)+0.01
        targets[int(all_values[0])]=0.99
        n.train(inputs, targets)
        pass
    pass

测试网络

上面，我们用了一个100条记录的数据进行网络训练，我们现在可以检测一下网络的效果怎么样。先来使用刚刚训练数据的第一条来进行测验一下。
首先我们要读取数据。

test_data_file = open("C:/Users/15619/train_file.csv", 'r')
test_data_list = test_data_file.readlines()
test_data_file.close()
all_values = test_data_list[0].split(',')
print(all_values[0])

下面展示了该条数据的正确结果为7.

我们来通过调用网络的query()函数来查询一下神经网络的输出。

test_inputs = (numpy.asfarray(all_values[1:])/255.0*0.99)+0.01
n.query(test_inputs)

输出的结果如下：

可见，输出的第八个节点，也就是对应’7’的节点数值比较大，而其他节点输出都比较小。说明网络的识别结果是正确的。
恭喜！我们成功达成了目的。训练神经网络，然后让网络告诉我们图片的内容是什么。这不过是训练数据集的一部分，仅仅使用了100个数据进行训练，这使得识别正确率不会很高。而完整的训练集有60000条记录。所以让我们继续编写代码，来看看神经网络到底有多大的能耐！

测试正确率的函数

下面让我们来写一个可以输出网络测试的正确率的函数

def test_acc(test_data_list):
    rightnum = 0
    allnum = 0
    for record in test_data_list:
        allnum+=1.0
        all_values = record.split(',')
        correct_label = int(all_values[0])
        inputs = (numpy.asfarray(all_values[1:])/255*0.99)+0.01
        outputs = n.query(inputs)
        label = numpy.argmax(outputs)
        if(label == correct_label):
            rightnum+=1.0
        pass
    acc = rightnum/allnum
    print("Accuracy:",acc)

经过调用函数测试，得到的正确率如下图所示。

可见正确率不是很高，接下来我们会使用完整的数据进行训练，然后测试一下正确率。看看效果如何吧！

五、完整的训练

让我们修改一下文件路径，然后就可以对完整的文件进行训练。训练结果如下：

可见，大量的数据对精度提升有着很大的作用，这个表现令人吃惊。几乎是95%的准确率。到这里我们完成了对神经网络的简单尝试，而且取得了非常好的效果。

; 学习率的调整

后续我们可以继续对网络进行改进，以求得到更高精度的结果。比如我们可以调整隐含层节点，或者学习率。本次训练使用的是0.3的学习率，如果我们尝试了使用0.6的学习率，输出的精度会有所下降，达到0.90。似乎朝着不好的方向发展了。然后尝试调整到0.1，我们发现精度可以高达0.9523,这似乎让网络更好了。
显然学习率的选择对于结果有重要影响，所以选择一个合适的学习率很重要。
下面的图表展示了学习率与正确率的一个曲线关系图。

训练轮数epoch

训练论数是什么意思呢？刚刚开始我也很难明白，觉得数据训练完了就可以了。但是后来才了解到，完整训练完一次成为一个epoch，而多个epoch也会对网络的训练效果有一定影响。
为什么要训练多次呢，其实是为了通过更多调整权值的机会，有利于梯度下降的权值更新。
我们对上面的代码进行改进一下看看。

for e in range(epochs):
    for record in training_data_list:
        all_values = record.split(',')

        inputs = (numpy.asfarray(all_values[1:])/255*0.99)+0.01

        targets = numpy.zeros(output_nodes)+0.01
        targets[int(all_values[0])]=0.99
        n.train(inputs, targets)
        pass
    pass

训练结果如下：

由于训练次数提升，电脑运算花费的时间也增加了，我的电脑运行了大概2分钟才得到结果。
上图可见从之前的0.9414提高到了0.951。虽然提升不是很高，但也是巨大进步。从这里我们证实了epoch数量确实会对效果造成一定影响。但是epochs数量是不是越大越好呢。我们来用一个图片展示一下epoch大小对网络精度的影响。
Python神经网络识别手写数字-MNIST数据集

改变网络结构

由于网络结构的输入节点和输出节点已经固定了，因此我们只能通过改变隐含层的节点数来观察结构对网络训练效果的影响。
我们来试图改变一下隐含层节点数，将其从100变道200，然后看看效果怎么样。

效果不是很明显，但是重在有一定提升。下面展示了隐含层节点与网络训练效果之间的关系曲线。
Python神经网络识别手写数字-MNIST数据集

; 附录代码

import numpy
import scipy.special
import matplotlib.pyplot
%matplotlib inline

class neuralNetwork():

    def __init__(self, inputnodes, hiddennodes, outputnodes, learningrate):
        self.innodes = inputnodes
        self.hinodes = hiddennodes
        self.outnodes = outputnodes
        self.lr = learningrate

        self.winhi = numpy.random.normal(0.0, pow(self.hinodes, -0.5),      (self.hinodes, self.innodes))

        self.whiout = numpy.random.normal(0.0, pow(self.outnodes, -0.5),(self.outnodes, self.hinodes))

        self.activation_function = lambda x: scipy.special.expit(x)
        pass

    def train(self, inputs_list, targets_list):

        inputs = numpy.array(inputs_list,ndmin=2).T
        targets = numpy.array(targets_list,ndmin=2).T

        hidden_inputs = numpy.dot(self.winhi, inputs)
        hidden_outputs = self.activation_function(hidden_inputs)

        final_inputs = numpy.dot(self.whiout, hidden_outputs)
        final_outputs = self.activation_function(final_inputs)

        output_errors = targets - final_outputs
        hidden_errors = numpy.dot(self.whiout.T, output_errors)

        self.whiout +=self.lr*numpy.dot((output_errors*final_outputs*(1-    final_outputs)), numpy.transpose(hidden_outputs))

        self.winhi +=self.lr*numpy.dot((hidden_errors*hidden_outputs*(1.0-hidden_outputs)), numpy.transpose(inputs))

    def query(self, inputs_list):
        inputs = numpy.array(inputs_list,ndmin=2).T
        hidden_inputs = numpy.dot(self.winhi, inputs)

        hidden_outputs = self.activation_function(hidden_inputs)

        final_outputs = numpy.dot(self.whiout, hidden_outputs)

        final_outputs = self.activation_function(final_outputs)
        return final_outputs

def test_acc(test_data_list):
    rightnum = 0
    allnum = 0
    for record in test_data_list:
        allnum+=1.0
        all_values = record.split(',')
        correct_label = int(all_values[0])
        inputs = (numpy.asfarray(all_values[1:])/255*0.99)+0.01
        outputs = n.query(inputs)
        label = numpy.argmax(outputs)
        if(label == correct_label):
            rightnum+=1.0
        pass
    acc = rightnum/allnum
    print("Accuracy:",acc)

input_nodes = 784
hidden_nodes = 200
output_nodes = 10
learning_rate = 0.3
epochs = 3

n = neuralNetwork(input_nodes, hidden_nodes, output_nodes,learning_rate)

training_data_file = open("C:/Users/15619/Downloads/mnist_train.csv", 'r')
training_data_list = training_data_file.readlines()
training_data_file.close()

for e in range(epochs):
    for record in training_data_list:
        all_values = record.split(',')

        inputs = (numpy.asfarray(all_values[1:])/255*0.99)+0.01

        targets = numpy.zeros(output_nodes)+0.01
        targets[int(all_values[0])]=0.99
        n.train(inputs, targets)
        pass
    pass

test_data_file = open("C:/Users/15619/Downloads/mnist_test.csv", 'r')
test_data_list = test_data_file.readlines()
test_data_file.close()

test_acc(test_data_list)

Original: https://blog.csdn.net/Thebluewinds/article/details/120321713
Author: Thebluewinds
Title: Python神经网络识别手写数字-MNIST数据集

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/709963/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

python以第一列为索引列_关于python：查找以列表形式存在的列元素的数据框索引的最快方法…

我有一个pandas数据框，其中的列值作为列表存在。每个列表都有几个元素，一个元素可以存在于多行中。一个示例数据框是： X = pd.DataFrame([(1,[‘a…

人工智能 2023年7月7日
0076
出现 The column label ‘ID‘ is not unique. For a multi-index, the label must be a tuple 解决方法

目录 1. 问题所示 2. 解决方法 3. 科普to_clipboard函数 ; 1. 问题所示数据预处理过程中，合并两张表的数据，代码出现如下问题: ValueError: T…

人工智能 2023年7月7日
0043
python 广义似然比_回归五式第三式：定序回归——手机功能对消费者偏好的影响分析（内含报告和Python、R代码）…

0 目录 1.简单分析报告 2.具体操作（1）数据读取和处理（2）描述性分析（3）假设检验与参数估计（4）模型选择（5）预测和评估 3.代码和数据集链接 4.参考文献正…

人工智能 2023年6月18日
0066
模型可解释性-shap value

Shap值衡量特征的边际贡献度，是当前模型解释的最佳方法之一，对于模型进行可视化的全局解释、局部解释，可以在一定程度上满足业务对于模型解释性的要求。其全局解释，（特征对于整体模型的…

人工智能 2023年6月15日
0095
【爬虫实战项目】Python爬取Top100电影榜单数据并保存csv文件（附源码）

前言今天给大家介绍的是Python爬取Top100电影榜单数据保存csv文件，在这里给需要的小伙伴们代码，并且给出一点小心得。首先是爬取之前应该尽可能伪装成浏览器而不被识别出来…

人工智能 2023年7月29日
0086
GMM广义矩估计

矩估计是什么呢？简单的说，就是用样本矩代替总体矩进行统计推断的方法。一个最基础的例子是正态总体的参数估计问题。如果X i ∼ N ( μ , σ 2 ) X_i \sim N(\…

人工智能 2023年7月1日
0073
Python爬虫之Scrapy框架（案例练习）

@作者 : SYFStrive @博客首页 : HomePage; 🥧 上一篇续文传送门 📌：个人社区（欢迎大佬们加入） 👉：社区链接🔗 📌：如果觉得文章对你有帮助可以点点关注…

人工智能 2023年6月19日
0093
RepVGG：算法简介及repvgg.py代码解析

论文链接：RepVGG: Making VGG-style ConvNets Great Again 代码链接：https://github.com/DingXiaoH/RepVG…

人工智能 2023年6月23日
00133
OpenCV-Python实战（3）——OpenCV中绘制图形与文本

[ OpenCV_是一款非常强大的计算机视觉库，其 _中_包含了很多功能强大的 _图像处理_和计算机视觉算法。而在这个系列的第三篇文章 _中，我们将重点介绍如何在 OpenCV 中…

人工智能 2023年6月18日
00104
K210神经网络的训练以及出现内存不足的情况memory not enough解决方案

目录介绍开始训练训练完成 memory not enough报错解决方案一：解决方案二：介绍最近在搞K210神经网络搭建识别数字，在烧入代码的时候就有很多坑，记录一下…

人工智能 2023年6月17日
00118
工业相机——黑白相机像素格式排列解析

了解图像格式，首先要了解图像的常用属性：像素(Pixel)：人眼直接感受到的图像位图(bitmap)：通过记录每一个像素值来存储和表达的图像位深度：位图中每个像素点用多少个二…

人工智能 2023年6月17日
0073
SPANNER: Named Entity Re-/Recognition as Span Prediction

命名实体识别（在联合抽取中，命名实体识别是一个部分，也会影响到关系抽取的质量，对于命名实体识别，目前主要涉及在细粒度命名实体识别、嵌套、不连续命名实体识别等）相关的方法主要有两大类…

人工智能 2023年6月1日
0084
RNA 21. SCI 文章中单基因富集分析

点击关注，桓峰基因桓峰基因生物信息分析，SCI文章撰写及生物信息基础知识学习：R语言学习，perl基础编程，linux系统命令，Python遇见更好的你 88篇原创内容公众号…

人工智能 2023年7月16日
0066
EfficientNet网络详解

原论文名称： EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks论文下载地址：http…

人工智能 2023年6月16日
0093
self-attention和rnn计算复杂度的对比

Attention is all you need论文中的实验分析部分罗列了self-attention和rnn的复杂度对比，特此记录一下自己对二者复杂度的分析。注意：n表示序列…

人工智能 2023年5月27日
0065
三子棋游戏的实现

目录一、问题描述二、基本流程三、流程四、结果演示 *五、代码实现一、问题描述用C语言实现三子棋游戏。二、基本流程 1.菜单界面选择开始或者退出游戏。2.创建棋盘并初始…

人工智能 2023年7月16日
0058

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Python神经网络识别手写数字-MNIST数据集

Python神经网络识别手写数字-MNIST数据集

输入数据处理

输出数据处理

测试网络

测试正确率的函数

; 学习率的调整

训练轮数epoch

改变网络结构

大家都在看