重学深度学习系列—LeNet5实现手写数字识别(TensorFlow2-mnist数据集)

2023年5月23日下午5:40 • 人工智能 • 阅读 56

文章目录

重学深度学习系列—LeNet5实现手写数字识别(TensorFlow2-mnist数据集)
*
我的环境：
一、LeNet5简单介绍
二、LeNet-5代码实现
三、训练
四、对图片进行预测
五、训练过程截图：
参考资料

我的环境：

TensorFlow2.3.0 、Pycharm、Windows10

代码已发布在码云上：https://gitee.com/jiangyi-yan/re-learning-and-deep-learning/tree/master/1.LeNet5_Mnist

或者在 百度网盘下载：
链接：https://pan.baidu.com/s/1J–9eUJMDB9SbRB5xwIr8Q
提取码：2022
–来自百度网盘超级会员V4的分享

一、LeNet5简单介绍

LeNet-5模型由LeCun等人于1998年提出，主要用于手写数字识别和英文字符识别，是卷积神经网络的鼻祖，其网络结构简单，却能取到良好的识别的效果。在MNIST数据集上，LeNet-5模型可以达到99.2%的准确率。

论文链接：http://yann.lecun.com/exdb/publis/pdf/lecun-98.pdf

其网络结构图如下：

重学深度学习系列---LeNet5实现手写数字识别(TensorFlow2-mnist数据集)

可以看到LeNet5网络 有7层：

1.第1层：卷积层

输入：原始的图片像素矩阵（长度、宽度、通道数），大小为32×32×1；

参数：滤波器尺寸为5×5，深度为6，不使用全0填充，步长为1；

输出：特征图，大小为28×28×6。

分析：因为没有使用全0填充，所以输出尺寸 = 32 – 5 + 1 = 28，深度与滤波器深度一致，为6。

2.第2层：池化层

输入：特征图，大小为28×28×6；

参数：滤波器尺寸为2×2，步长为2；

输出：特征图，大小为14×14×6。

3.第3层：卷积层

输入：特征图，大小为14×14×6；

参数：滤波器尺寸为5×5，深度为16，不使用全0填充，步长为1；

输出：特征图，大小为10×10×16。

分析：因为没有使用全0填充，所以输出尺寸 = 14 – 5 + 1 = 10，深度与滤波器深度一致，为16。

4.第4层：池化层

输入：特征图，大小为10×10×16；

参数：滤波器尺寸为2×2，步长为2；

输出：特征图，大小为5×5×6。

5.第5层：全连接层

输入节点个数：5×5×16 = 400；

参数个数：5×5×16×120+120 = 48120；

输出节点个数：120。

6.第6层：全连接层

输入节点个数：120；

参数个数：120×84+84 = 10164；

输出节点个数：84。

7.第7层：全连接层

输入节点个数：84；

参数个数：84×10+10 = 850；

输出节点个数：10。

; 二、LeNet-5代码实现


model = tf.keras.Sequential([

    keras.layers.Conv2D(6,5),

    keras.layers.MaxPooling2D(pool_size=2,strides=2),
    keras.layers.ReLU(),

    keras.layers.Conv2D(16,5),

    keras.layers.MaxPooling2D(pool_size=2,strides=2),
    keras.layers.ReLU(),
    keras.layers.Flatten(),

    keras.layers.Dense(120,activation='relu'),

    keras.layers.Dense(84,activation='relu'),

    keras.layers.Dense(10,activation='softmax')
])

由于MNIST数据集图片大小是28×28的，所以在训练时可以把卷积核尺寸调小为3×3。当然，不修改也没问题。

三、训练

import tensorflow as tf
from tensorflow import keras
print(tf.__version__)

batchsize = 32

model = tf.keras.Sequential([

    keras.layers.Conv2D(6,5),

    keras.layers.MaxPooling2D(pool_size=2,strides=2),
    keras.layers.ReLU(),

    keras.layers.Conv2D(16,5),

    keras.layers.MaxPooling2D(pool_size=2,strides=2),
    keras.layers.ReLU(),
    keras.layers.Flatten(),

    keras.layers.Dense(120,activation='relu'),

    keras.layers.Dense(84,activation='relu'),

    keras.layers.Dense(10,activation='softmax')
])

model.build(input_shape=(batchsize,28,28,1))

model.summary()

model.compile(optimizer=keras.optimizers.Adam(),
              loss = keras.losses.CategoricalCrossentropy(),
              metrics=['accuracy'])

def preprocess(x,y):
    x = tf.cast(x,dtype=tf.float32) / 255
    x = tf.reshape(x,[-1,28,28,1])
    y = tf.one_hot(y,depth=10)
    return x,y

(x_train,y_train),(x_test,y_test) = tf.keras.datasets.mnist.load_data()

print('x_train=',type(x_train))
print('y_train=',type(y_train))

train_db = tf.data.Dataset.from_tensor_slices((x_train,y_train))
print('train_db=',type(train_db))
train_db = train_db.shuffle(10000)
train_db = train_db.batch(128)
train_db = train_db.map(preprocess)

test_db = tf.data.Dataset.from_tensor_slices((x_test,y_test))
print('test_db=',type(test_db))
test_db = test_db.shuffle(10000)
test_db = test_db.batch(128)
test_db = test_db.map(preprocess)

model.fit(train_db,epochs=10)

model.evaluate(test_db)

model.save('./lenet5.h5')

四、对图片进行预测

前面已经训练过并已经保存了训练后的模型，因此可以调用模型进行预测。

from PIL import Image
import numpy as np
from tensorflow.keras.models import load_model
import cv2

model = load_model('./model/lenet5.h5')

def predict(image_path):

    img = Image.open(image_path).convert('L')
    img.resize((28,28))
    img = np.reshape(img, (28, 28, 1)) / 255.

    x = np.array([1 - img])

    y = model.predict(x)

    print(image_path)
    print(y[0])
    print('the number is :', np.argmax(y[0]))

if __name__ == "__main__":
    img = cv2.imread('./imgs/1.jpg', 0)
    img = cv2.resize(img, (28, 28))
    cv2.imwrite('./test.jpg', img)
    predict('./test.jpg')

我们预测的图片可以是任意尺寸的，但是送入网络预测时都必须resize成28×28的，这里由于我不太熟悉image库，格式调整起来比较麻烦，所以我先用opencv库进行resize再保存下来，然后对这张图片进行预测（比较笨的方法）。

预测结果：

五、训练过程截图：

1.输出网络结构：

2.训练过程：

; 参考资料

1.《深度学习实践教程》吴微

2.LeNet-5论文链接：http://yann.lecun.com/exdb/publis/pdf/lecun-98.pdf

Original: https://blog.csdn.net/Aiden_yan/article/details/122999563
Author: 三个臭皮姜
Title: 重学深度学习系列—LeNet5实现手写数字识别(TensorFlow2-mnist数据集)

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/496905/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

[数学建模]MATLAB回归分析

一、前言第24届冬季奥林匹克运动会在北京隆重展开，我们要研究一个问题：奥运会东道主是否有优势？在历史数据中，我们发现好像东道主的国家在当年奥运会上获得金牌的数目比四年前非东道主国…

人工智能 2023年6月16日
0067
Python中print()函数的几种输出形式，含标准化输出

在python中print()函数输出字符加变量有很多种形式，本文做一个整理！假设我们要输出的句子是：张三的年龄是20岁，收入为1万元每月。其中张三，20，1是变量。 name…

人工智能 2023年7月4日
0091
海康VisionMaster配合机械手九点标定

文章目录一、图像源二、标定板标定三、N点标定四、标定转换总结一、图像源添加图像源，在图像源里添加标定板图片 ; 二、标定板标定拖入标定板标定右键点击标定板标定，在运…

人工智能 2023年7月28日
0082
树莓派4b上部署yolov3和v3-tiny记录带截图

首先在 PC 上进行yolov3的模型训练和测试，得到.weight和.cfg文件，这两个文件要进行模型的转换然后在树莓派上部署。一、在树莓派上烧录镜像，buster10系统即可…

人工智能 2023年7月12日
0037
android apk内语音控制

最近的音频播放项目需要在应用程序中进行语音控制。 [En] Recent audio playback projects require voice control within …

人工智能 2023年5月23日
0059
numpy之警告VisibleDeprecationWarning: Creating an ndarray from ragged nested sequences

目录警告解决警告这是我写的读取npz文件的代码， datas = np.load("bsm.npz", allow_pickle=True) print…

人工智能 2023年7月5日
0051
C++ String类（下） String类的模拟实现

作者：@小萌新专栏：@C++初阶作者简介：大二学生希望能和大家一起进步本篇博客介绍：本篇博客会收尾String类的使用以及模拟String类的实现模拟String类的实现本章…

人工智能 2023年6月30日
0088
OpenCV4 目标跟踪(二)《详解稀疏光流、稠密光流》

作者：RayChiu_Labloy版权声明：著作权归作者所有，商业转载请联系作者获得授权，非商业转载请注明出处目录光流定义：光流的应用领域：光流法基本原理基本假设条件： …

人工智能 2023年7月20日
0046
五分钟快速搭建一个实时人脸口罩检测系统(OpenCV+PaddleHub 含源码)

导读本文主要介绍如何使用OpenCV和PaddleHub实现一个实时人脸口罩检测系统。（公众号：OpenCV与AI深度学习）背景介绍从19年疫情爆发到现在，佩戴口罩对大家来说…

人工智能 2023年6月19日
0061
Visual Studio 配置OpenCV C++版

OpenCV+Visual Studio 2022的C++学习路线一、VS配置 * 1. OpenCV下载 2. 安装二、创建项目 * 运行一、VS配置 1. OpenCV下…

人工智能 2023年7月20日
0057
阿里天池供应链需求预测比赛小结

阿里天池供应链需求预测比赛小结一、赛题的思路回顾 1.1赛题描述使用历史平均来预测未来的需求使用测试集真实数据进行过拟合的结果名词定义库存水位在仓库存数量，用来满足需求…

人工智能 2023年7月17日
0093
Qt 实现配置 OpenCV 环境，并实现打开图片与调用摄像头

一、说明所用QT版本：5.9.1 电脑配置：win10，64位系统调用的是编译好的：OpenCV-MinGW-Build-4.1.0（点击链接进码云仓库）在大学期间，由于项目…

人工智能 2023年7月19日
0062
基于GRNN广义回归神经网络的飞机引擎剩余使用周期预测算法的研究

目录一、理论基础 1.1数据分析 1.2特征提取 1.3GRNN 二、核心程序三、仿真测试结果 作者ID ：f…

人工智能 2023年6月16日
0070
Pandas Panel三维数据结构

Panel 结构也称”面板结构”，它源自于 Panel Data 一词，翻译为”面板数据”。如果您使用的是 Pandas 0.25 …

人工智能 2023年7月7日
0081
Pandas数据整理

1.Pandas中有两个主要的数据结构：Series和DataFrame。 Serise：一维的数据结构。Series是一个类似一维数组的对象，它能够保存任何类型的数据，主要由一组…

人工智能 2023年7月6日
0073
基于skimage的数字图像处理（一）——基础

数字图像处理基础前言一、skimage是什么？ * 1.模块内容 2.安装skimage包二、图片显示三、图片的基本属性信息四、图像通道总结前言简单了解数字图像处…

人工智能 2023年7月6日
0068

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

重学深度学习系列—LeNet5实现手写数字识别(TensorFlow2-mnist数据集)

文章目录

我的环境：

一、LeNet5简单介绍

; 二、LeNet-5代码实现

三、训练

四、对图片进行预测

五、训练过程截图：

; 参考资料

大家都在看