深度学习之基于CNN实现汉字版手写数字识别（Chinese-Mnist）

2023年5月26日下午8:15 • 人工智能 • 阅读 89

Mnist数据集是深度学习入门的数据集，昨天发现了Chinese-Mnist数据集，与Mnist数据集类似，只不过是汉字数字，例如’一’、’二’、’三’等，本次实验利用自己搭建的CNN网络实现Chinese版的手写数字识别。

1.导入库

import tensorflow as tf
import matplotlib.pyplot as plt
import os,PIL,pathlib
import numpy as np
import pandas as pd
import warnings
from tensorflow import keras

warnings.filterwarnings("ignore")
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False
os.environ['TF_CPP_MIN_LOG_LEVEL']='2'

2.数据加载

原数据中包括15000张图片，如下所示：

原数据并没有将各类数据分开，而是给出了一个csv文件：

在进行训练之前将图片分类，首先对数据的标签进行切片

train = pd.read_csv("E:/tmp/.keras/datasets/chinese_mnist/chinese_mnist.csv")

train_image_label = [i for i in train["character"]]

train_label_ds = tf.data.Dataset.from_tensor_slices(train_image_label)

统计每张图片的具体路径：


img_dir = "E:/tmp/.keras/datasets/chinese_mnist/data/data/input"
train_image_paths = []
for row in train.itertuples():
    suite_id = row[1]
    sample_id = row[2]
    code = row[3]
    train_image_paths.append(img_dir+"_"+str(suite_id)+"_"+str(sample_id)+"_"+str(code)+".jpg")

train_path_ds = tf.data.Dataset.from_tensor_slices(train_image_paths)

train_image_paths结果如下：

E:/tmp/.keras/datasets/chinese_mnist/data/data/input_1_1_10.jpg

读取图片并进行预处理，然后切片


def preprocess_image(image):
    image = tf.image.decode_jpeg(image,channels = 3)
    image = tf.image.resize(image,[height,width])
    return image / 255.0
def load_and_preprocess_image(path):
    image = tf.io.read_file(path)
    return preprocess_image(image)

train_image_ds = train_path_ds.map(load_and_preprocess_image,num_parallel_calls=tf.data.experimental.AUTOTUNE)

将train_image_ds与train_label_ds组合在一起

image_label_ds = tf.data.Dataset.zip((train_image_ds,train_label_ds))

显示图片：

for i in range(20):
    plt.subplot(4, 5, i + 1)
    num +=1
    plt.xticks([])
    plt.yticks([])
    plt.grid(False)

    images = plt.imread(train_image_paths[i])
    plt.imshow(images)

    plt.xlabel(train_image_label[i])

plt.show()

在并未对数据进行shuffle之前，如下所示：

原数据中一共15000张图片，分为15类，每类1000张，并按照顺序排列，因此需要对数据进行打乱。

image_label_ds = image_label_ds.shuffle(15000)

按照8：2的比例划分训练集与测试集

train_ds = image_label_ds.take(12000).shuffle(2000)
test_ds = image_label_ds.skip(12000).shuffle(3000)

超参数的设置

height = 64
width = 64
batch_size = 128
epochs = 50

对训练集与测试集进行batch_size 划分

train_ds = train_ds.batch(batch_size)
train_ds = train_ds.prefetch(buffer_size=tf.data.experimental.AUTOTUNE)
test_ds = test_ds.batch(batch_size)
test_ds = test_ds.prefetch(buffer_size=tf.data.experimental.AUTOTUNE)

再次检查图片，看看是否被打乱顺序：

plt.figure(figsize=(8, 8))

for images, labels in train_ds.take(1):

    for i in range(12):
        ax = plt.subplot(4, 3, i + 1)
        plt.imshow(images[i])
        plt.title(labels[i].numpy())

        plt.axis("off")
    break
plt.show()

顺序已被打乱，初始目标完成。

3.网络搭建&&编译

model = tf.keras.Sequential([
    tf.keras.layers.Conv2D(filters=32,kernel_size=(3,3),padding="same",activation="relu",input_shape=[64, 64, 3]),
    tf.keras.layers.MaxPooling2D((2,2)),
    tf.keras.layers.Conv2D(filters=64,kernel_size=(3,3),padding="same",activation="relu"),
    tf.keras.layers.MaxPooling2D((2,2)),
    tf.keras.layers.Conv2D(filters=64,kernel_size=(3,3),padding="same",activation="relu"),
    tf.keras.layers.MaxPooling2D((2,2)),
    tf.keras.layers.Flatten(),
    tf.keras.layers.Dense(64, activation="relu"),
    tf.keras.layers.Dense(15, activation="softmax")
])

model.compile(optimizer="adam",
                loss='sparse_categorical_crossentropy',
                metrics=['accuracy'])
model.summary()
history = model.fit(
    train_ds,
    validation_data=test_ds,
    epochs = epochs
)

经过50次epochs，训练结果如下：

准确率达到了100%

4.混淆矩阵的绘制

模型加载：

model = tf.keras.models.load_model("E:/Users/yqx/PycharmProjects/chinese_mnist/model.h5")

标签列表如下所示：

all_label_names = ['零','一','二','三','四','五','六','七','八','九','十','百','千','万','亿']

绘制混淆矩阵

from sklearn.metrics import confusion_matrix
import seaborn as sns
import pandas as pd

all_label_names = ['零','一','二','三','四','五','六','七','八','九','十','百','千','万','亿']
def plot_cm(labels, pre):
    conf_numpy = confusion_matrix(labels, pre)
    conf_df = pd.DataFrame(conf_numpy, index=all_label_names,
                               columns=all_label_names)
    plt.figure(figsize=(8, 7))

    sns.heatmap(conf_df, annot=True, fmt="d", cmap="BuPu")
    plt.title('混淆矩阵', fontsize=15)
    plt.ylabel('真实值', fontsize=14)
    plt.xlabel('预测值', fontsize=14)
    plt.show()

model = tf.keras.models.load_model("E:/Users/yqx/PycharmProjects/chinese_mnist/model.h5")

test_pre = []
test_label = []
for images, labels in test_ds:
    for image, label in zip(images, labels):
        img_array = tf.expand_dims(image, 0)
        pre = model.predict(img_array)
        test_pre.append(all_label_names[np.argmax(pre)])
        test_label.append(all_label_names[label.numpy()])
plot_cm(test_label, test_pre)

总结：本次实验最复杂的就是标签处理那一块，只有处理好这一步骤，才能正确的将图片和标签划分到一起。实验数据只有15000张，而Mnist数据集有70000张，虽然本次的模型准确率达到了100%，但是仍有可能在别的图片预测错误。

努力加油a啊

Original: https://blog.csdn.net/starlet_kiss/article/details/120086841
Author: starlet_kiss
Title: 深度学习之基于CNN实现汉字版手写数字识别（Chinese-Mnist）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/521712/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【机器视觉】——平面测量实际尺寸（像素尺寸转物理尺寸）

方法一：比例尺法方法:二：三角法方法三：相机标定以下方法均在平面的前提下进行在一张纸上绘制一个带刻度的直线，将纸张放在摄像头下，抓取任意两点的像素坐标，计算像素距离pd,再…

人工智能 2023年5月28日
0078
深度学习生成对抗网络（GAN）

一、概述生成对抗网络(Generative Adversarial Networks)是一种无监督深度学习模型，用来通过计算机生成数据，由Ian J. Goodfellow等人于…

人工智能 2023年7月4日
0068
这几个Python数据可视化探索实例，拿走不谢

推荐阅读：1、程序员用Python爬虫做副业半个月就赚了3W2、一个30岁的程序员无比挣扎的故事，连躺平都是奢望利用可视化探索图表一、数据可视化与探索图数据可视化是指用图形或…

人工智能 2023年7月15日
0056
医院管理源码排队叫号管理源码

啊哦~你想找的内容离你而去了哦内容不存在，可能是由于以下原因造成的： [En] The content does not exist and may be caused by t…

人工智能 2023年5月27日
0082
网络安全观察报告

攻击类型分析 2018 年，主要的攻击类型 1 为 SYN Flood，UDP Flood，ACK Flood，HTTP Flood，HTTPS Flood，这五大类攻击占了总攻…

人工智能 2023年7月31日
0048
windows和linux平台C++工程如何连接第三方依赖库

C++工程如何连接第三方依赖库本文以opencv为例说明分别在windows平台用VS2019以及linux平台下使用CMake如何连接项目的第三方依赖库 VS2019设置第三…

人工智能 2023年7月20日
0089
【通信原理】揭开傅里叶级数与傅里叶变换的神秘面纱

🚀个人主页：欢迎访问Ali.s的首页 ⏰ 最近更新：2022年8月18日 ⛽ Java框架学习系列：【Spring】【SpringMVC】【Mybatis】 🔥 Java项目实战系…

人工智能 2023年7月25日
0090
【论文笔记_目标检测_2022】DaViT: Dual Attention Vision Transformers

; 摘要在这项工作中，我们介绍了双注意视觉变换器（DaViT），这是一个简单而有效的视觉变换器架构，能够在保持计算效率的同时捕捉全局环境。我们建议从一个正交的角度来处理这个问题：…

人工智能 2023年7月10日
0070
分布式追踪与监控：Skywalking

文章目录 1.APM介绍 2.分布式链路追踪 3.Apache Skywalking(Incubator)简介 4.SkyWalking 原理架构图 5.SkyWalking 核心…

人工智能 2023年6月28日
00106
安卓Android百度输入法皮肤-疯狂码字的快乐-《Write 2022升级版》

《Write 2022升级版》疯狂码字的快乐、实用皮肤，百度输入法请注意，皮肤是基于百度官方输入法，不能在华为/一加/小米等定制版下使用。 [En] Please note t…

人工智能 2023年5月27日
0097
图像分割论文阅读笔记——U-Net: Convolutional Networks for Biomedical Image Segmentation

文章来源 https://paperswithcode.com/paper/u-net-convolutional-networks-for-biomedical U-Net: C…

人工智能 2023年6月22日
0079
EfficientNet网络结构详解

Stage1为Conv， Stage2~8为MBConv，Stage9为Conv + Pooling + FC第三列Resolution(分辨率)为输入每个Stage时的分辨率(高…

人工智能 2023年7月22日
0089
曾经，我对着AI客服喷了两分钟，它只回复了我的第一句话

梦晨发自凹非寺量子位 | 公众号 QbitAI 不知不觉间，接打快递、银行等电话时，遇到AI的情况越来越多了。目前和这些AI沟通，还得讲究一个技巧：要保持你我句子的标准节…

人工智能 2023年5月25日
00134
Pandas性能优化:进阶篇

在这里介绍一些更高级的pandas优化方法。 1 numpy 我们先来回顾一下上节说过的一个例子 import pandas as pd import numpy as np im…

人工智能 2023年7月7日
0075
R语言为矩阵的行和列命名：rownames函数指定矩阵行名称、colnames函数指定矩阵列名称

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月23日
0087
【深度学习】肺结节分割项目实战一：处理数据集

主要参考此教程完成的实验一、LIDC-IDRI数据集简介官方网站肺图像数据库协会的图像收集(LIDC-IDRI)包括诊断和带有病变注释标记的肺癌筛查胸部CT。这是一个网络…

人工智能 2023年6月17日
0086

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

深度学习之基于CNN实现汉字版手写数字识别（Chinese-Mnist）

1.导入库

2.数据加载

3.网络搭建&&编译

4.混淆矩阵的绘制

大家都在看