深度学习day04-MNIST手写数字识别与模型使用

2023年7月13日下午3:20 • 人工智能 • 阅读 84

本文大概分为以下几个部分：手写数字识别原理（不强相关）、具体代码实现（算上import和空行一共50行代码不到）、训练出来的模型怎么使用。

一、手写数字识别原理

二、具体代码实现

三、训练出来的模型怎么使用

一、手写数字识别原理

数字手写体识别由于其有限的类别（0~9共10个数字）成为了相对简单的手写识别任务。DBRHD和MNIST是常用的两个数字手写识别数据集，我们这次使用的就是MNIST。

怎样识别数字呢？这是一个矩阵，每一个点的数值根据我们之前所说的0-255呈现出黑色到白不同的颜色，大家可以看出来这是一个 7 一个 2

你可以通过这个矩阵想象出黑白色上他究竟是什么样子吗（上图中每一个格子都是长方形，所以数字看着显宽，而实际中矩阵的长款都是相等的，所以上图中我们看数字，尽量忽略掉颜色）

它们真实的样子是这样的：

我们可以实际对比一下是不是数字越小，颜色越黑，可以注意一下边边角角:

而在我们的架构中：

机器通过学习0-9的数字走向，最后得出这张图分别是0-9的概率是多大。老规矩，保持兴趣，以后我们再深入理解，现在我们开始动手了！

二、具体代码实现

先让我们看一看我们的数字：没有注释的地方都在前两天已经说过哦，不重复解释了

import tensorflow as tf
import numpy as np
import matplotlib.pyplot as plt
from tensorflow.keras import datasets,layers,optimizers,losses

def show_pic(X_train,Y_train):
    pic_arr = X_train[:9,:,:]
    pic_ind = Y_train[:9]
    plt.figure()
    for i in range(9):
        plt.subplot(3, 3, i+1)
        plt.imshow(pic_arr[i,:,:],cmap='gray')
        plt.title(str(pic_ind[i]))
    plt.show()

//获取Keras自带的mnist数据集分为训练集（(X_train,Y_train)）和验证集（(X_test,Y_test)）
(X_train,Y_train),(X_test,Y_test) = datasets.mnist.load_data()

show_pic(X_train,Y_train)
show_pic(X_test,Y_test)

其中X对应的是矩阵，也就是图像；而Y对应的则是图像的数字。比如一张图像 X是数字9的矩阵，则对应的 Y就是9这个数字

看到这些数字了，接下来我们训练模型，在刚才的代码块后面：

X_train = np.reshape(X_train,[60000,28*28])
X_test = np.reshape(X_test,[10000,28*28])

y_train = title_Y(Y_train,10)
y_test = title_Y(Y_test,10)

//建立一个模型，里面是三层全连接，格式都是固定的，最后一次的数字由于我有0-9十个选项，所以写10
model = tf.keras.Sequential([
    layers.Dense(700, activation='relu'),
    layers.Dense(350,activation='relu'),
    layers.Dense(10,activation='softmax')
])

//定义损失和优化函数，不懂原理的可以直接这么写，之前也有介绍
opt = optimizers.SGD(learning_rate=0.001)
loss = losses.CategoricalCrossentropy()

//创建这个模型
model.build(input_shape=[None,784])
//定义优化，损失，准确率
model.compile(optimizer=opt,loss=loss,metrics=['accuracy'])
//训练次数，执行到这一句，就开始训练了
model.fit(x=X_train,y=y_train,batch_size=100,epochs=25,validation_data=(X_test,y_test))

准确率会逐步提升，当然也有可能下降一段时间

三、训练出来的模型怎么使用

首先用save()将我们的模型全部保存下来，.h5是专属后缀

model.save('model.h5')

之后我们可以使用这个命令导入我们曾经保存的模型：

model = tf.keras.models.load_model('model.h5')

这样就可以对单独一张图进行预测了，当然，具体是保存整个模型，还是只保存权重，后来发现也是有不一样的，各有优势，更多的模型保存问题和选择会在下一篇详细介绍。

更新：

深度学习TensorFlow—保存和加载 Keras 模型_昊昊该干饭了的博客-CSDN博客目录Keras简介保存整个模型保存模型的权重Keras简介Keras 模型由多个组件组成：架构或配置，它指定模型包含的层及其连接方式。一组权重值（即”模型的状态”）。优化器（通过编译模型来定义）。一组损失和指标（通过编译模型或通过调用add_loss()或add_metric()来定义）。我们可以通过 Keras API 将这些片段一次性保存到磁盘，或仅选择性地保存其中一些片段：将所有内容以 TensorFlow SavedModel 格式（或较早的… 深度学习day04-MNIST手写数字识别与模型使用 https://blog.csdn.net/qq_52213943/article/details/123842076 ;

写在最后：思考与学习的过程可能会很难，也很慢，你在短时间内也不一定能想清楚，它可能需要花费你1个月、1年，甚至更长的时间…但是，你千万别放弃，它值得你用那么长的时间来思考，因为一旦想清楚，你的人生可能就会从此不同！

你有多长时间只顾低头赶路而忽略了路边的风景呢？

Original: https://blog.csdn.net/qq_52213943/article/details/123806148
Author: 昊昊该干饭了
Title: 深度学习day04-MNIST手写数字识别与模型使用

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/690101/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

偏最小二乘(PLS)原理分析&Python实现

目录 1 偏最小二乘的意义 2 PLS实现步骤 3 弄懂PLS要回答的问题 4 PLS的原理分析 4.1 自变量和因变量的主成分求解原理 4.1.1 确…

人工智能 2023年7月30日
00123
社交网络的数据挖掘与分析,什么是社交网络分析

社交网络数据挖掘理解基于计算机的社会网络的一种可能方法是Garton等人（1997年）提出的”社会网络分析”（SNA）工具和方法论，来创建一幅描述知识网络…

人工智能 2023年6月26日
0060
我用Python采集了班花的空间数据集，除了美照竟然再一次发现了她另外的秘密！

大家好，我是辣条。室友知道了我上次给班花修过电脑，追了我三条街，嘴里大骂我不当人子，怪我这种事情没带他。最后又舔着脸求我支招，这货竟然想追班花！辣条我为了兄弟两（收）肋（钱）插（…

人工智能 2023年7月3日
00110
新春特辑 | 中台战略专题合辑报告下载

志在哪里，哪里就有成功；心在哪里，哪里就有风景；爱在哪里，哪里就有感动。在新年来临之际，互联互通社区衷心祝愿您：春节快乐，身体健康，心想事成！ 1、中国非结构化数据中台实践白皮书…

人工智能 2023年6月10日
0073
FCN全卷积网络理解及代码实现（来自pytorch官方实现）

视频链接：https://www.bilibili.com/video/BV1J3411C7zd?vd_source=a0d4f7000e77468aec70dc618794d26…

人工智能 2023年5月26日
0086
MFCC语音信号特征提取——主要知识点总结

MFCCs(Mel Frequency Cepstral Coefficents) 是一种常用语语音识别，说话人识别的特征提取方法。一、提取特征的主要过程：对语音进行预加重、…

人工智能 2023年5月25日
0063
六轴传感器+卡尔曼滤波+一阶低通滤波

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录角度与角速度测量 * – 1.角度与角速度获取 2 互补滤波 3卡尔曼滤波 4 实现卡尔一阶…

人工智能 2023年7月27日
0057
机器学习 —— 神经网络（matlab）

目录一、介绍二、实验数学原理三、实验算法和实验步骤四、实例分析一、介绍神经网络是一种运算模型，由大量的节点（或称”神经元”，或”单元…

人工智能 2023年6月12日
0087
李宏毅机器学习2-回归

李宏毅机器学习2-回归案例学习 Regression 股票预测系统：input过去十年股票起伏资料，output股市明天的平均值自动驾驶车辆：input sensor感受到的信息…

人工智能 2023年6月18日
0097
Qt QImage 图像处理(翻转,灰度，亮度）代码实现

1.界面效果该程序利用QImage类对图片像素进行操作，实现图像的翻转，转灰度，增加亮度的效果。模拟图像处理效果背后的算法实现。后续可以陆续增加其他图像处理功能，可进一步扩展。 …

人工智能 2023年6月18日
00179
RLChina2022-强化学习暑期课程-博弈搜索算法

《RLChina2022-强化学习暑期课程-博弈搜索算法》的学习笔记主讲人：中科院自动化林舒老师 RLChina2022-强化学习暑期课程-博弈搜索算法学习笔记序列决策问题 *…

人工智能 2023年5月27日
0088
【python】遇上COS美图怎么办？当然是大胆冲呀~

前言嗨喽~大家好呀，这里是魔王呐 ! 在这炎热得夏天~ 我不由得想要东西来放松一下~ 于是，我采集起了小姐姐COS图~ ; 开发环境: Python 3.8 Pycharm 模块…

人工智能 2023年7月3日
0075
意念打字登Nature封面！每分钟写90个字符，准确率超99%，网友：我打的都比它慢…

杨净梦晨发自凹非寺量子位报道 | 公众号 QbitAI 万万没想到，脑机接口这么快就有了重大突破！甚至还登上了 Nature封面。一位截瘫患者，正在用”…

人工智能 2023年7月13日
0049
[人脸算法]技术方向综述

01 人脸技术的应用人脸硬件产品：考勤支付，安防监控，医疗美容人脸软件产品：各类娱乐软件，如美图秀秀 02 人脸图像算法及其研究方向人脸检测核心算法目的：检测图像中是否存在人…

人工智能 2023年6月6日
0081
Selenium被检测为爬虫，怎么屏蔽和绕过

Selenium 操作被屏蔽使用selenium自动化网页时，有一定的概率会被目标网站识别，一旦被检测到，目标网站会拦截该客户端做出的网页操作。比如淘宝和大众点评的登录页，当手…

人工智能 2023年7月4日
0068
知识图谱 ppt_送你浙大陈华钧教授《知识图谱导论》课程系列PPT

来源：专知本文约 1500字，建议阅读 10分钟。本文为你介绍了浙江大学计算机学院陈华钧教授的课程《知识图谱导论》。知识图谱是人工智能的前沿科技之一，近两年非常火热。无论你是…

人工智能 2023年6月1日
0047

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

深度学习day04-MNIST手写数字识别与模型使用

一、手写数字识别原理

二、具体代码实现

三、训练出来的模型怎么使用

大家都在看