tensorflow实现手写数字识别

2023年5月23日下午5:07 • 人工智能 • 阅读 117

从torch入门的我，很排斥tensorflow, 不过最近不得不学了，不然我刚找的工作怕是要换人了。

ok,那让我们愉快的学习吧。

我们先来一个AI届的Hello World !! . 手写数字识别。然后遇到其中的问题我们再来一一解释，毕竟最快的学习方式还是项目！

本系列计划在我完成手写识别后直接找工作的领域尝试再现经典的推荐算法模型。完成复制，然后重新补充理论。

[En]

This series is planned to try to reproduce the classic recommendation algorithm model in the field where I am looking for a job directly after completing handwriting recognition. Complete the reproduction and then re-supplement the theory.

由于工业界对于tensorflow 1 系列的依赖太强，我们选用tensorflow 1.13.1 版本来进行。

环境准备
tensorflow=1.13.1
数据准备

from tensorflow.examples.tutorials.mnist import input_data
mnist = input_data.read_data_sets("MNIST_data",one_hot=True)

我们看一下这个数据规模，以train为例：

mnist.train.images.shape

得到的结果为：

(55000, 784)

这个784实际上为24*24，就是每个图片的784个像素现在被拉成一行了。我们随便取一个数据，将其拉伸回24 × 24 24\times24 2 4 ×2 4,就可以看到整个图片了。

import pylab
im = mnist.train.images[1]
im = im.reshape(-1,28)
pylab.imshow(im)
pylab.show()

既然数据这么小，我们先试试线性回归吧。

[En]

Since the data is so small, let’s try linear regression first.

构建模型和初始化参数

线性模型没啥好说的：

y = X W T + b y = \bold{X}\bold{W^T} + b y =X W T +b

其中的参数只有W \bold{W}W和b b b。对于静态图为依托的tensorflow 1.x来说，我们需要先构建完成整个模型的传输体系，然后将其放在sess中，才能真正的开始运行。

现在，让我们构建模型和参数。

[En]

Now let’s build the model and parameters.

对于数据，我们需要首先指定它的大小，但没有真正的数据，所以我们可以在运行时提供它。指定尺寸的方法是使用占位符：

[En]

For data, we need to specify its size first, but there is no real data, so we can feed it in at run time. The way to specify dimensions is to use placeholders:


tf.reset_default_graph()
x = tf.placeholder(tf.float32,[None,784])
y = tf.placeholder(tf.float32,[None,10])
x.shape,y.shape

对于初始化参数来说，这个模型中的参数无非就是包含W和b,对于卷积来说，其参数无非就是卷积核和偏置。那个在后续中会讲解。

W = tf.Variable(tf.random_normal(([784,10])))
b = tf.Variable(tf.zeros([10]))
W,b

输出


pred = tf.nn.softmax(tf.matmul(x,W)+b)

定义训练过程


cost = tf.reduce_mean(-tf.reduce_sum(y*tf.log(pred),reduction_indices=1))
learning_rate = 0.01
optimizer = tf.train.GradientDescentOptimizer(learning_rate).minimize(cost)

training_epochs = 25
batch_size = 100
display_step = 1

with tf.Session() as sess:
  sess.run(tf.global_variables_initializer())

  for epoch in range(training_epochs):
    avg_cost = 0
    total_batch = int(mnist.train.num_examples/batch_size)
    for i in range(total_batch):
      batch_xs,batch_ys = mnist.train.next_batch(batch_size)
      _, c = sess.run([optimizer,cost],feed_dict={x:batch_xs,y:batch_ys})
      avg_cost += c/total_batch
    if (epoch + 1)%display_step == 0:
      print(f"Epoch:{epoch+1},cost={avg_cost:.9f}")
  print("fnished")

  correct_prediction = tf.equal(tf.argmax(pred,1),tf.argmax(y,1))
  accuracy = tf.reduce_mean(tf.cast(correct_prediction,tf.float32))
  print("Accuracy:",accuracy.eval({x:mnist.test.images,y:mnist.test.labels}))

我们分析一下，其与torch的不同之处，

tensor训练时必须要在sess之内，否则不会真实运行
tensor取数据的时候是x.next_batch(batch_size)
sess.run([优化器，损失函数]，feed_dict={数据字典}) –> _,cost
评估方式，method = tf.xx(), method.eval({数据字典})

ok,最后的运行结果是这样的。

Epoch:1,cost=7.546023723
Epoch:2,cost=4.171652060
Epoch:3,cost=2.972595831
Epoch:4,cost=2.377042001
Epoch:5,cost=2.016216151
Epoch:6,cost=1.779922282
Epoch:7,cost=1.617819570
Epoch:8,cost=1.489061758
Epoch:9,cost=1.393508704
Epoch:10,cost=1.312454587
Epoch:11,cost=1.255874819
Epoch:12,cost=1.191187488
Epoch:13,cost=1.152227032
Epoch:14,cost=1.099380152
Epoch:15,cost=1.076827528
Epoch:16,cost=1.038087001
Epoch:17,cost=1.014115727
Epoch:18,cost=0.983060481
Epoch:19,cost=0.969432110
Epoch:20,cost=0.936379928
Epoch:21,cost=0.926966454
Epoch:22,cost=0.899857285
Epoch:23,cost=0.897358320
Epoch:24,cost=0.867424971
Epoch:25,cost=0.862724741
fnished
Accuracy: 0.8281

Original: https://blog.csdn.net/qq_34271349/article/details/123557862
Author: 古承风
Title: tensorflow实现手写数字识别

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/496689/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

(一)路径规划算法—Astar与C++可视化在RVIZ的二维栅格地图

Astar与C++可视化在RVIZ的二维栅格地图中文章目录 Astar与C++可视化在RVIZ的二维栅格地图中 * 1.功能包介绍 2.二维栅格地图以及相关坐标系说明 &#821…

人工智能 2023年6月25日
0085
将COCO格式的数据集转换为VOC（以HRSID和SSDD数据集为例）

本文主要参考博客HRSID舰船检测数据集标签格式转换，json转为xml，在其代码基础上加入大量理解性注释、对其中个别代码进行修改，并在后面附加了json文件中提取信息写成VOC格…

人工智能 2023年7月27日
0063
Image Super-Resolution via Iterative Refinement 论文解读和感想

随着20年DDPM的提出，近两年提出了大量基于Denoising Diffusion的图像处理模型，本文便是谷歌在21年 CVPR提出的基于Denoising Diffusion的…

人工智能 2023年7月27日
0067
.NET 中 GC 的模式与风格

垃圾回收（GC）是托管语言必备的技术之一。GC 的性能是影响托管语言性能的关键。我们的 .NET 既能写桌面程序 (WINFROM , WPF) 又能写 web 程序 (ASP.N…

人工智能 2023年6月6日
00106
【数据分析】京东平台用户画像分析

1.用户信息标签用户信息的收集包括用户基础要素、用户场景、行为偏好、心理个性、交际等多方面。可以用静态标签、动态标签两大类来划分。静态数据:用户相对稳定的信息，主要包括人口属性、…

人工智能 2023年7月15日
00210
Android R窗口Window的requestlayout过程大揭秘

Android R窗口Window的requestlayout过程大揭秘 Android应用程序窗口设计系列博客: Android应用程序窗口设计之Window及WindowMan…

人工智能 2023年6月28日
0090
阿里天池：小样本商标检测（baseline0.50）

阿里天池：小样本商标检测（baseline0.50）在学会YOLO目标检测后第一次参加这样的比赛，特此做个记录，此处也提出一些改进的方案。比赛链接：ICME-2022 安全AI挑…

人工智能 2023年7月10日
0090
yolov7配置环境

有参考小俊俊的博客的教程，但是中间出了一些小问题自己看着解决的。一、新建yolov7虚拟环境1、在pycharm中新建一个项目，命名为yolov7点击File—-…

人工智能 2023年6月23日
0085
哈工大机器学习期末复习笔记（一）

一、贝叶斯估计当我们需要对一个参数进行估计时，一种办法是概率论与数理统计课程中已经学过的极大似然估计（Maximum Likelihood Estimation，MLE）。例如，…

人工智能 2023年6月15日
0080
写完Numpy100道基础练习题后的错误总结和语法总结

前言：由于是看视频学习的缘故，在写这100道题目道中有很多视频中没有出现的语法，然而很多语法直接拿来用都是比较简单的，少了很多的循环语句。至此写下这篇错误总结和语法总结，希望可以给…

人工智能 2023年7月4日
0080
java计算机毕业设计bs架构实习管理系统源码+mysql数据库+系统+lw文档+部署

本源码技术栈：项目架构：B/S架构开发语言：Java语言开发软件：idea eclipse 前端技术：Layui、HTML、CSS、JS、JQuery等技术后端技术：JAV…

人工智能 2023年6月28日
0081
模型之T5，UniLM，MASS，GPT

公司项目上有个文本生成的任务，难度比较大，花了相对不短的时间去熟悉这些模型，当然也没花太久，大概也就是读了下论文，以及网友们的一些介绍，现在记录总结下，后续应该会去阅读以及改写相关…

人工智能 2023年5月28日
0095
R语言绘图中图片的组合（cowplot、patchwork宏包、layout、par()、gridExtra）

组合图片（1） cowplot 可以使用 cowplot 宏包的 plot_grid()函数完成多张图片的组合，使用方法很简单。 p1 % ggplot(aes(x = gdpP…

人工智能 2023年7月15日
0075
CD-Hit 生信碱基序列去除冗余的方法

1.CD-Hit介绍官方介绍： CD-HIT是一个非常广泛使用的程序，用于蛋白质或核苷酸序列的聚类和比较。最初由李伟忠博士在伯纳姆研究所（现为桑福德伯纳姆医学研究所）亚当·戈兹克…

人工智能 2023年6月2日
00121
Docker部署nacos 添加配置文件提示：发布失败。请检查参数是否正确

首先，中安装MySQL。可以通过以下命令来安装： </p> <p>run –name mysql -p 3306:3306 -e MYSQL_ROOT_…

人工智能 2023年6月29日
00100
使用JAGS训练贝叶斯回归模型

Fitting Baysian Regression Models Using JAGs In Baysian statistics I use samples from the …

人工智能 2023年6月18日
0079

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

tensorflow实现手写数字识别

大家都在看