Keras深度学习（1）-全连接手写数字的识别

2023年5月25日上午1:26 • 人工智能 • 阅读 62

在各种主流的深度学习框架中，手写数字的识别均作为第一个入门教程，同样，在开始学习Keras这个近些年非常流行的深度学习框架时，也用全连接手写数字识别作为入门的第一个例子。
为了紧跟时代潮流，在之后我的所有博客中，均使用TensorFlow2以上的版本，而在TensorFlow2中的版本，Keras已经集成到tf中去了，可见谷歌也在逐步放弃TensorFlow1中的模型搭建方法，转而使用Keras来进行模型训练。因此可见，Keras的优势，也希望大家从一开始就学习Keras。
使用的TensorFlow版本：2.5.0

1 全连接手写数字模型的训练

训练代码如下所示：

from tensorflow.keras.datasets import mnist
from tensorflow.keras import models
from tensorflow.keras import layers
from tensorflow.keras.utils import to_categorical

if __name__=='__main__':

    (train_images,train_lables),(test_images,test_lables)=mnist.load_data()

    train_images=train_images.reshape(train_images.shape[0],-1)

    train_images=train_images.astype('float32')/255

    test_images=test_images.reshape(test_images.shape[0],-1)
    test_images=test_images.astype('float32')/255

    train_lables=to_categorical(train_lables)
    test_lables=to_categorical(test_lables)

    network=models.Sequential()
    network.add(layers.Dense(units=512,activation='relu',input_shape=(28*28,)))
    network.add(layers.Dense(units=10,activation='softmax'))

    network.compile(optimizer='rmsprop',loss='categorical_crossentropy',metrics=['accuracy'])
    network.summary()

    history=network.fit(x=train_images,y=train_lables,epochs=5,batch_size=128)
    print(history.history)

    test_loss,test_acc=network.evaluate(x=test_images,y=test_lables)
    print(test_acc)

    network.save(filepath='./model/test.h5')

模型框架采用两层神经网络结构，数据输入结构为(784，)

[En]

The model framework adopts a two-layer neural network structure, and the structure of data input is (784,)

第一个隐藏层的权重参数W1形状为(784,512)，偏置为(512,)，
隐藏层的激活函数采用Relu函数，Relu函数的公式为：

输出图像为：

第二层为输出层，输出层的权重参数形状为(512,10),偏置为(10,)，因为手写数字的识别属于分类问题，分类问题的输出层激活函数使用softmax函数，softmax函数的数学公式如下：

这一句代码也很重要：

network.compile(optimizer='rmsprop',loss='categorical_crossentropy',metrics=['accuracy'])

optimizer=’rmsprop’表示在神经网络训练中，参数的更新采用的方法为rmsprop，该方法可以一开始多学，之后少学，也就是一开始的学习率设置的大一些，随着训练的进行，学习率会逐渐降低。
loss=’categorical_crossentropy’表示为损失函数为分类交叉熵，工时如下：

使用上面的代码训练，训练过程如下：

[En]

Using the code training above, the training process is as follows:

Epoch 1/5
469/469 [==============================] - 5s 8ms/step - loss: 0.2536 - accuracy: 0.9266
Epoch 2/5
469/469 [==============================] - 4s 8ms/step - loss: 0.1035 - accuracy: 0.9695
Epoch 3/5
469/469 [==============================] - 4s 9ms/step - loss: 0.0696 - accuracy: 0.9789
Epoch 4/5
469/469 [==============================] - 5s 10ms/step - loss: 0.0494 - accuracy: 0.9848
Epoch 5/5
469/469 [==============================] - 5s 10ms/step - loss: 0.0375 - accuracy: 0.9887
{'loss': [0.25358861684799194, 0.10348740965127945, 0.06957202404737473, 0.04940706863999367, 0.03746318444609642], 'accuracy': [0.9265999794006348, 0.9694666862487793, 0.9788500070571899, 0.9847833514213562, 0.9887333512306213]}
313/313 [==============================] - 1s 2ms/step - loss: 0.0676 - accuracy: 0.9797
0.9797000288963318

训练完成后，得到h5模型文件，我们使用Netron这个工具查看模型文件，可以很清晰的查看模型的网络结构图。

2 全连接手写数字模型的调用

在对模型进行训练后，我们可以使用该模型对手写数字图像进行预测，从而进一步检验该模型的效果。

[En]

After training the model, we can use the model to predict the handwritten digital image, which can further test the effect of the model.

调用代码如下：

from tensorflow.keras.datasets import mnist
from tensorflow.keras import models
import numpy as np
import cv2

if __name__=='__main__':

    (train_images,train_lables),(test_images,test_lables)=mnist.load_data()

    test_img=test_images[2]
    test_img=test_img.reshape(test_img.shape+(1,))

    cv2.imshow('test',test_img)
    cv2.waitKey(0)

    model=models.load_model('./model/test.h5')

    test_data=test_img.reshape(1,-1)
    test_data=test_data.astype('float32')/255
    output=model.predict(test_data)
    print(output)

    output_argmax=output.argmax(axis=1)
    print(output_argmax)

    print('模型预测的值为：'+str(output_argmax[0]))
    print('图片的真实标签值为：'+str(test_lables[2]))

识别的图像显示为：

预测的结果为：

[[6.3377036e-07 9.9490094e-01 4.5994075e-04 5.5514480e-05 9.1660942e-05
  1.7706998e-05 3.7915866e-05 2.5628312e-03 1.8701523e-03 2.7018891e-06]]
[1]
模型预测的值为：1
图片的真实标签值为：1

由此可见，该模型对图像的预测结果是正确的。

[En]

It can be seen that the prediction result of the model for the picture is correct.

Original: https://blog.csdn.net/qq_37781464/article/details/122684455
Author: Keras深度学习
Title: Keras深度学习（1）-全连接手写数字的识别

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/511214/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

基于 BP 神经网络基本原理拟合确定函数

BP（back propagation）即反向传…

人工智能 2023年7月14日
0060
【Python数据分析与可视化】期末复习试题集

; 1.Jupyter notebook不具备的功能是（） Jupyter notebook可以直接生成一份交互式文档 Jupyter notebook可以安装Python库 J…

人工智能 2023年7月16日
00248
【COCO数据集】Annotations标注解析

COCO dataset 是计算机视觉领域中最流行的数据集之一，用于对各种视觉任务进行基准测试，例如目标检测、分割、关键点检测等。在数据集中，有 118K张图像用于训练， 5K张…

人工智能 2023年6月24日
00174
Apollo学习笔记（1）：Ubantu20.04安装Apollo7.0

前言最近有实现Carla与Apollo联合仿真的想法,必备条件就是都两个软件部署到Ubantu20.04上，目前已经完成Carla 0.9.13的部署工作，详见Carla学习笔记…

人工智能 2023年7月28日
0085
2023年，前端开发未来可期

☆对于很多质疑，很多不解，本文将从△ 目前企业内前端开发职业的占比；△ 目前业内开发语言的受欢迎程度；△ 近期社区问答活跃度；等维度来说明目前前端这个职业的所处位置。 ☆还有强硬的…

人工智能 2023年7月19日
0063
讯飞AIUI智能机器人7—–文字识别

🍖🍖🍖🍖🍖🍖🍖🍖🍖 🍖🍖🍖🍖🍖🍖🍖🍖 🍖🍖🍖🍖🍖🍖🍖🍖 🍖🍖🍖🍖🍖🍖🍖🍖 🍖🍖🍖🍖🍖🍖🍖🍖 🍖🍖🍖🍖🍖🍖🍖🍖 🍖🍖🍖🍖🍖🍖🍖🍖 🍖🍖🍖🍖🍖🍖🍖🍖 🍖🍖🍖🍖🍖🍖🍖🍖 🍖🍖🍖🍖🍖🍖🍖🍖…

人工智能 2023年6月17日
00101
使用ResNet50对QuickDraw数据集做图像分类

前言 quickdraw数据集是序列数据集，包含画画的动作等信息。我将quickdraw数据集转换成黑底白字的png图片，对其做多分类。本文使用pytorch，和预训练过的resn…

人工智能 2023年7月17日
0082
锚框(anchor box)/先验框(prior bounding box)概念以及yolov3中的使用

1.概念关于先验框，有的paper(如Faster RCNN)中称之为anchor(锚点)，有的paper(如SSD)称之为prior bounding box(先验框)，实际上…

人工智能 2023年7月27日
0088
嵌入式系统开发笔记106：发光二极管间隔闪烁

文章目录前言一、关键代码 * 1、主函数 2、缺省线程二、代码解释 * 1、主函数 2、缺省线程 3、while（1） 4、Target.Delayms(1000); 5、类…

人工智能 2023年6月27日
0058
深度学习-通过Resnet18实现CIFAR10数据分类

文章目录 * – + * 1. CIFAR10数据集 * 2. Resnet18 * 3. 迁移学习 * 4. 代码实现 * – 4.1 导入程序所需的包 …

人工智能 2023年6月30日
00107
图神经网络及其Pytorch实现

图结构一般而言是十分不规则的，可以认为是无限维的一种数据，因此不存在平移不变性。每一个结点周围的结构都是独一无二的，因此针对该结构的数据。涌现出GNN、DeepWalk、node2…

人工智能 2023年7月22日
0052
修改蓝牙耳机按键映射_有了它，再挑剔的耳朵也会听话-360PlayBuds真无线蓝牙耳机体验…

最近笔者外出锻炼，为了避免健身的枯燥，我经常用有线耳机听音乐、打电话、微信语音等，所以需要一个音质和语音都不错的耳机，但有线耳机也带来了很多不便。耳机线晃来晃去，很容易挂断，所以笔…

人工智能 2023年5月27日
0090
如何解决过拟合的问题

如何解决过拟合的问题 1. 问题介绍过拟合（overfitting）是指机器学习模型在训练集上表现非常好，但在测试集上表现较差的现象。过拟合通常是由于模型过于复杂，导致模型学习了…

人工智能 2024年1月1日
0054
Google Earth Engine——250米处美国农业部土壤分类的预测数据集

Predicted USDA soil great group probablities at 250m Distribution of the USDA soil great g…

人工智能 2023年7月3日
00117
[Python从零到壹] 四十.图像处理基础篇之图像量化处理

欢迎大家来到”Python从零到壹”，在这里我将分享约200篇Python系列文章，带大家一起去学习和玩耍，看看Python这个有趣的世界。所有文章都将结合…

人工智能 2023年6月22日
0091
sklearn_Lasso与多项式回归_菜菜视频学习笔记

lasso与多项式回归 1 Lasso与多重共线性 * 1.1 Lasso 强大的特征选择能力 1.2 选取最佳正则化参数 2. 非线性问题：多项式回归 * 2.1 使用分箱处理非…

人工智能 2023年6月18日
0061

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Keras深度学习（1）-全连接手写数字的识别

大家都在看