手写数字彩色图像识别-Keras实现（基于R语言）

2023年6月20日下午1:34 • 人工智能 • 阅读 125

本文摘自《Keras深度学习：入门、实战及进阶》一书。
本小节我们将利用MNIST数据集的训练数据训练模型，MNIST数据集的测试数据评估模型，再利用训练好的模型对本地的50个手写数字图像进行预测，查看预测效果。
在num文件夹中已经保存了50张0~9的彩色数字图像

使用EBImage包的readImage()函数将num文件夹中的所有数字图像读取到R中。

> library(keras)
> library(EBImage)
>
> setwd('../num')
> temp  paste(1:50,'png',sep = '.')
> mypic  list()
> for (i in 1:length(temp)) {mypic[[i]]  readImage(temp[[i]])}

利用for循环语句，已经将50张数字图像读入到R中。利用plot()函数查看读取的数字图像。

>
> par(mfrow=c(10,5))
> for(i in 1:50) plot(mypic[[i]])
> par(mfrow=c(1,1))

在对数据图像处理前，让我们先查看各个图像的维度大小。以下程序将每张图像的实际值和三个维度的实际大小保存到size对象中，并查看前六张图像的数据情况。

>
> size  data.frame(pic = 1:50,
+                num = rep(0:9,each = 5),
+                dim1 = sapply(mypic,dim)[1,],
+                dim2 = sapply(mypic,dim)[2,],
+                dim3 = sapply(mypic,dim)[3,])
> head(size)
  pic num dim1 dim2 dim3
1   1   0  122  106    3
2   2   0  119  106    3
3   3   0  126  100    3
4   4   0  125  115    3
5   5   0  124  118    3
6   6   1  100  108    3

数据框size中的dim1、dim2、dim3分别对应图像的像素宽度、像素高度和颜色通道。因为dim3列的值均为3，所以这些数字图像均为彩色图像，需利用colorMode()函数将它们转变为灰色图像。因为各图像的dim1和dim2值不相同，故这些图像大小不一致，需利用resize()函数进行处理。

>
> for (i in 1:length(temp)) {colorMode(mypic[[i]])  Grayscale}
> for (i in 1:length(temp)) {mypic[[i]]  1-mypic[[i]]}
> for (i in 1:length(temp)) {mypic[[i]]  resize(mypic[[i]], 28, 28)}
> for (i in 1:length(temp)) {mypic[[i]]  array_reshape(mypic[[i]], c(28,28,3))}
> new  NULL
> for (i in 1:length(temp)) {new  rbind(new, mypic[[i]])}
> newx  new[,1:784]
> newy  size$num

最后，再次使用plot()函数查看经过处理后的数字图像。

>
> par(mfrow=c(5,10))
> for(i in 1:50) plot(as.raster(array_reshape(newx[i,],c(28,28))))
> par(mfrow=c(1,1))

以下是MNIST数据预处理代码。

>
> mnist  dataset_mnist()
> trainx  mnist$train$x
> trainy  mnist$train$y
> testx  mnist$test$x
> testy  mnist$test$y
>
> trainx  array_reshape(trainx, c(nrow(trainx), 784))
> testx  array_reshape(testx, c(nrow(testx), 784))
> trainx  trainx / 255
> testx  testx /255
>
> trainy  to_categorical(trainy, 10)
> testy  to_categorical(testy, 10)

以下是深度学习建模代码。

>
> build_model  function() {
+   model  keras_model_sequential() %>%
+     layer_dense(units = 512, activation = 'relu', input_shape = c(784)) %>%
+     layer_dropout(rate = 0.4) %>%
+     layer_dense(units= 256, activation = 'relu') %>%
+     layer_dropout(rate = 0.3) %>%
+     layer_dense(units = 10, activation = 'softmax')
+
+   model %>% compile(
+     loss = 'categorical_crossentropy',
+     optimizer = optimizer_rmsprop(),
+     metrics = 'accuracy')
+   model
+ }

以下是训练模型代码。

> model  build_model()
> history  model %>% fit(
+  trainx,
+  trainy,
+  epochs = 30,
+  batch_size = 32,
+  validation_split = 0.2)
> plot(history)

以下是对彩色数据进行预测。

>
> pred  model %>% predict_classes(newx)
> t  table(Actual = newy,Predicted = pred)
> t
Actual 0 1 2 3 4 5 6 7 8 9
     0 4 0 1 0 0 0 0 0 0 0
     1 0 5 0 0 0 0 0 0 0 0
     2 0 0 5 0 0 0 0 0 0 0
     3 0 0 1 4 0 0 0 0 0 0
     4 0 1 1 0 2 0 0 0 0 1
     5 0 0 0 0 0 4 0 0 1 0
     6 0 0 0 0 0 4 1 0 0 0
     7 0 0 1 1 0 0 0 2 1 0
     8 0 0 3 1 0 0 0 0 0 1
     9 0 0 0 1 1 1 2 0 0 0

从混淆矩阵可知，除了1、2这两种数字图像全部预测正确外，其他数字图像均有预测结果与实际值不一致情况。
通过以下程序代码绘制预测与实际不一致的数字图像。

> ind  which(newy!=pred)
> par(mfrow=c(4,6))
> for(i in ind){
+   plot(as.raster(array_reshape(newx[i,],c(28,28))))
+   title(paste('Actual=',newy[i],'Predicted=',pred[i]))
+ }
> par(mfrow=c(1,1))

从可知，数字8、9全部预测错误，数字6有4个预测错误，数据4、7各有3个预测错误，数字0、3、6分别有1个预测错误。

Original: https://blog.csdn.net/jiabiao1602/article/details/124071659
Author: jiabiao1602
Title: 手写数字彩色图像识别-Keras实现（基于R语言）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/641364/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

对于云原生时代的后端业务开发和项目系统学习，选Go Or Java？

对于Go的一些思考沉淀前言开山之词：简洁度比较大不相同：Go的独特之处 * Go的并发 Go的指针 Go的性能分析器 Go的类型 Go的CGo Go的将函数作为参数瑕疵劣势…

人工智能 2023年5月31日
0074
京东用户行为分析

京东用户行为分析 *项目背景京东作为传统电商巨头，京东商城与京东物流的发展相得益彰，然而各种新兴的电商模式，带来了千人千面的购物方式和电商平台更加激烈的竞争，电商平台发展初…

人工智能 2023年6月11日
0081
【论文精读】HumanNeRF

目录 Abstract 1.Introduction 2.Related work * Human specific rendering Neural radiance field…

人工智能 2023年7月28日
0083
中科大&快手提出多模态交叉注意力模型：MMCA，促进图像-文本多模态匹配！

关注公众号，发现CV技术之美本文分享论文『Multi-Modality Cross Attention Network for Image and Sentence Match…

人工智能 2023年5月27日
0098
目标检测-＞SSD算法

目标检测算法总体分为：基于区域的算法和基于回归的算法 1）基于区域的算法： RCNN, Fast RCNN, Faster RCNN, Mask RCNN 等。整个检测过程分为两个…

人工智能 2023年6月23日
00186
tensorflow 目标检测API安装和使用教程

环境 tensorflow == 2.8.0 win10 or linux 概要目标检测项目的主要步骤如下：搭建虚拟环境采集图像并打标训练预测模型的保存和转换调优项…

人工智能 2023年5月24日
0071
遥感图像目标检测研究综述

遥感图像目标检测遥感图像特殊性一、目标检测研究综述 * 1.介绍 2.传统目标检测 3.基于深度学习目标检测 – R-CNN系列为代表的两阶段算法 YOLO、SSD…

人工智能 2023年5月26日
0077
tensorflow2的常用函数记录与实例

刚学tensorflow框架，英文api文档找起来太麻烦，故学习之初先记录一些创建一个tensor 1.创建常量 tf.constant(张量内容，dtype=数据类型（可选)）…

人工智能 2023年5月24日
0049
【OpenCV 例程200篇】222. 特征提取之弗里曼链码（Freeman chain code）

OpenCV 例程200篇总目录【youcans 的 OpenCV 例程 300篇】222. 特征提取之弗里曼链码（Freeman chain code）目标特征的基本概念 …

人工智能 2023年6月18日
0071
CVPR2020 论文和代码合集

【推荐阅读】 CVPR 2020 virtual ECCV 2020 论文开源项目合集来了：https://github.com/amusi/ECCV2020-Code 关于往年C…

人工智能 2023年7月18日
0036
Keras 中的循环神经网络 (RNN)

简介循环神经网络 (RNN) 是一类神经网络，它们在序列数据(如时间序列或自然语言)建模方面非常强大。简单来说，RNN 层会使用 for&#…

人工智能 2023年5月24日
00126
外设驱动库开发笔记48：MCP4725单通道DAC驱动

在产品设计过程中，我们经常会遇到数模转换的应用需求。在本篇种我们就来讨论一下MCP4725单通道数模转换器的驱动设计与实现。 1、功能概述 MCP4725是一个低功耗，高精度，单通…

人工智能 2023年7月20日
0076
人体姿态估计的基本概念

注：B站有相应视频，点击此链接即可跳转观看https://www.bilibili.com/video/BV1hb4y117mu/ 第1节：人体姿态估计的基本概念 1.1含义人体…

人工智能 2023年6月15日
0096
缺失值处理的常用方法：判断、查找、填充及删除

处理缺失值流程与方法汇总： 1.读取数据 import numpy as np data = np.genfromtxt("test.txt",delimite…

人工智能 2023年7月7日
0059
centos7篇—centos7中安装mongodb

centos7中安装mongodb 方式一： * 1. 安装环境 2. 安装过程启用授权验证方式二： * RHEL/CentOS 用户刷新缓存并安装 mongodb-org。…

人工智能 2023年7月31日
0060
KernelGAN论文详解分享

KernelGAN- Blind Super-Resolution Kernel Estimation using an Internal-GAN论文详解论文地址：https:/…

人工智能 2023年6月20日
0081

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

手写数字彩色图像识别-Keras实现（基于R语言）

大家都在看