3.MNIST数据集分类

2023年7月14日上午3:49 • 人工智能 • 阅读 54

文章

*
– 一、MNIST数据集及Softmax
–
+ 1.MNIST数据集
+ 2.Softmax
– 二、MNIST数据集分类
–
+ 1.导入第三方库
+ 2.加载数据及数据预处理
+ 3.训练模型

一、MNIST数据集及Softmax

1.MNIST数据集

大多数示例使用手写数字的 MNIST数据集。该数据集包含 60,000个用于训练的示例和 10,000个用于测试的示例。

每一张图片包含 28*28个像素，在MNIST 训练数据集 中是一个 形状为[60000,28,28] 的张量，我们首先需要把数据集 转成[60000,784],然后才能放到网络中训练。 第一个维度数字用来 索引图片， 第二个维度数字用来索引每张图片中的 像素点。一般我们还需要把图片中的 数据归一化0~1之间。
3.MNIST数据集分类

MNIST数据集的标签是 介于0-9的数字，我们要把标签 转化为”one-hotvectors”。一个one-hot向量除了一位数字是1外，其余维度数字 都是0，比如标签0将表示为([1,0,0,0,0,0,0,0,0,0]),标签3将表示为([0,0,0,1,0,0,0,0,0,0])。
因此，MNIST数据集的标签是一个[60000,10]的数字矩阵。

2828=784， 每张图片有 784个像素点，对应着 784个神经元。最后输出 10个神经元对应着 10个数字*。

; 2.Softmax

Softmax作用就是把神经网络的输出转化为概率值。
我们知道MNIST的结果是0-9，我们模型可能推测出一张图片的数字9的概率是80%，是数字8的概率是10%，然后其他数字的概率更小，总体概率加起来等于1。这是一个使用softmax回归模型的经典案例。softmax模型可以用来给不同的对象分配概率。

二、MNIST数据集分类

代码运行平台为jupyter-notebook，文章中的代码块，也是按照jupyter-notebook中的划分顺序进行书写的，运行文章代码，直接分单元粘入到jupyter-notebook即可。

1.导入第三方库

import numpy as np
from keras.datasets import mnist
from keras.utils import np_utils
from keras.models import Sequential
from keras.layers import Dense
from tensorflow.keras.optimizers import SGD

2.加载数据及数据预处理


(x_train,y_train),(x_test,y_test) = mnist.load_data()

print("x_shape:\n",x_train.shape)

print("y_shape:\n",y_train.shape)

x_train = x_train.reshape(x_train.shape[0],-1)/255.0
x_test = x_test.reshape(x_test.shape[0],-1)/255.0

y_train = np_utils.to_categorical(y_train,num_classes=10)
y_test = np_utils.to_categorical(y_test,num_classes=10)

3.训练模型


model = Sequential([

        Dense(units=10,input_dim=784,bias_initializer='one',activation="softmax"),
])

sgd = SGD(lr=0.2)

model.compile(
    optimizer=sgd,
    loss="mse",
    metrics=['accuracy']
)

model.fit(x_train,y_train,batch_size=32,epochs=10)

loss,accuracy = model.evaluate(x_test,y_test)

print("\ntest loss",loss)
print("accuracy:",accuracy)

最终运行结果：

注意

Dense(units=10,input_dim=784,bias_initializer='one',activation="softmax")这里用到了 softmax激活函数。
这里我们使用的 fit方法进行的模型训练，之前的线性回归和非线性回归的模型训练方式和这不同。

代码：

model.compile(
    optimizer=sgd,
    loss="mse",
    metrics=['accuracy']
)

中 添加 metrics=['accuracy'], 可以在训练过程中计算准确率。

Original: https://blog.csdn.net/booze_/article/details/125621175
Author: booze-J
Title: 3.MNIST数据集分类

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/691235/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Pytorch深度学习实践_刘二大人

1. 穷举法和分治法传统的穷举法和分治法都面临着搜索空间太大或者容易陷入局部最优的问题。 ; 2. 梯度下降算法优化问题就是指找使得w w w最小值的问题。用目标函数对权重求…

人工智能 2023年7月24日
0074
文本分类模型合集-详细注解–tf/pytorch双版本

Overview 仓库地址：https://github.com/DengBoCong/text-similarity Overview Usages * – TF-I…

人工智能 2023年5月24日
0082
SimCSE: Simple Contrastive Learning of Sentence Embeddings(EMNLP 2021)

[EMNLP 2021] SimCSE: Simple Contrastive Learning of Sentence Embeddings Motivation 无监督的Sim…

人工智能 2023年5月28日
0064
基于目标检测的海上舰船图像超分辨率研究

基于目标检测的海上舰船图像超分辨率研究人工智能技术与咨询来源：《图像与信号处理》，作者张坤等关键词: 目标检测；生成对抗网络；超分辨率摘要: 针对海上舰船图像有效像素在…

人工智能 2023年7月11日
0053
Apollo Planning决策规划算法代码详解 (22):决策规划算法最完整介绍

前言：后台已经完成Apollo Planning决策规划算法的完整解析，从规划模块的入口OnLanePlanning开始，介绍到常见的规划器PublicRoadPlanner；接…

人工智能 2023年7月27日
0052
CornerNet详解

论文动机 1、anchor-box 好用，但是有两个缺点：1）、数量太多，造成负样本太多，样本不均衡，导致训练效率低。2）、anchor-box引入太多超级参数，数量，大小，长宽比…

人工智能 2023年7月13日
0078
NLP学习笔记-浅谈对话系统

本文目录 * – 引子 – 概念引入 – 生成式对话 – 检索式对话 – 任务完成型对话 – 对话系统目前面…

人工智能 2023年5月30日
0087
pythonpandas读取txt文件_python pandas：尝试读取txt文件，但显示NaN

我认为您需要sep参数，因为默认值是sep=’,’。在如果tab：names=[‘t[s]’,’digits[]&#8…

人工智能 2023年7月8日
0090
pandas 修改 DataFrame 列名

问题：有一个DataFrame，列名为： [‘$a’, ‘$b’, ‘$c’, ‘$d’, ‘$e’]现需要改为： [‘a’, ‘b’, ‘c’, ‘d’, ‘e’]有何办法？ i…

人工智能 2023年6月2日
0090
员工离职困扰？来看AI如何解决，基于人力资源分析的 ML 模型构建全方案

💡 作者：韩信子@ShowMeAI📘 数据分析实战系列：https://www.showmeai.tech/tutorials/40📘 机器学习实战系列：https://www.s…

人工智能 2023年6月19日
0077
【CV】图像恢复（降噪/超分/去雾/去雨/去模糊）顶会论文汇总

论文名称：A survey of deep learning approaches to image restoration论文下载：https://www.sciencedire…

人工智能 2023年5月26日
0099
调用云服务实现语音识别合成以及感情分析

人工智能 2023年5月23日
00100
小熊飞桨练习册-07PaddleX寻找火箭车车

小熊飞桨练习册-07PaddleX寻找火箭车车简介小熊飞桨练习册-07PaddleX寻找火箭车车，是学习目标检测小项目，本项目开发和测试均在 Ubuntu 20.04 系统下进…

人工智能 2023年6月4日
0087
Python打包成exe文件_详细操作

Python打包成exe文件前言一、安装pyinstaller * 1.1 安装pyinstaller，使用安装命令： 1.2 如果遇到需要更新版本请输入： 1.3 检查是否正…

人工智能 2023年7月4日
0055
信息学奥赛一本通：1307：【例1.3】高精度乘法

1307：【例1.3】高精度乘法时间限制: 1000 ms 内存限制: 65536 KB提交数: 49765 通过数: 18971 【题目描述】输入两个高精度正整数M和N（M和…

人工智能 2023年6月28日
0071
京东智联云&贪心科技：图卷积神经网络在推荐系统的应用

PDF下载：https://download.csdn.net/download/qq_40507857/14933374 B站视频：https://www.bilibili.co…

人工智能 2023年6月10日
0086

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31