深度学习模型理解-CNN-手写数据字代码

2023年6月16日下午3:10 • 人工智能 • 阅读 63

系列文章目录

提示：这里可以添加系列文章的所有文章的目录，目录需要自己手动添加
例如：第一章 Python 机器学习入门之pandas的使用

提示：写完文章后，目录可以自动生成，如何生成可参考右边的帮助文档

文章目录

系列文章目录
前言
一、卷积神经网络是什么
*
什么是卷积
网络结构
二、动图理解
*
卷积计算过程
激活函数
池化层
全连接层
不同的卷积核会得到不同的效果
三、手写数字数据集代码
*
数据集查看
–
- 数据集分析
- 数据集可视化
数据处理
网络搭建

前言

提示：这里可以添加本文要记录的大概内容：

例如：随着人工智能的不断发展，机器学习这门技术也越来越重要，很多人都开启了学习机器学习，本文就介绍了机器学习的基础内容。

提示：以下是本篇文章正文内容，下面案例可供参考

一、卷积神经网络是什么

什么是卷积

对图像（不同的数据窗口数据）和滤波矩阵（一组固定的权重：因为每个神经元的多个权重固定，所以又可以看做一个恒定的滤波器filter）做内积（逐个元素相乘再求和）的操作就是所谓的『卷积』操作，也是卷积神经网络的名字来源。

非严格意义上来讲，下图中红框框起来的部分便可以理解为一个滤波器，即带着一组固定权重的神经元。多个滤波器叠加便成了卷积层。

整体结果

卷积神经网络是一种带有卷积结构的深度神经网络，卷积结构可以减少深层网络占用的内存量，其三个关键的操作，其一是局部感受野，其二是权值共享，其三是pooling层，有效的减少了网络的参数个数，缓解了模型的过拟合问题。。

; 网络结构

上图中CNN要做的事情是：给定一张图片，是车还是马未知，是什么车也未知，现在需要模型判断这张图片里具体是一个什么东西，总之输出一个结果：如果是车那是什么车

最左边是数据输入层

对数据做一些处理，比如去均值（把输入数据各个维度都中心化为0，避免数据过多偏差，影响训练效果）、归一化（把所有的数据都归一到同样的范围）、PCA/白化等等。CNN只对训练集做”去均值”这一步。

中间是

CONV：卷积计算层，线性乘积求和。
RELU：激励层，上文2.2节中有提到：ReLU是激活函数的一种。
POOL：池化层，简言之，即取区域平均或最大。

最右边是

FC：全连接层
这几个部分中，卷积计算层是CNN的核心，下文将重点阐述。

二、动图理解

卷积计算过程

在CNN中，滤波器filter（带着一组固定权重的神经元）对局部输入数据进行卷积计算。每计算完一个数据窗口内的局部数据后，数据窗口不断平移滑动，直到计算完所有数据。这个过程中，有这么几个参数：
a. 深度depth：神经元个数，决定输出的depth厚度。同时代表滤波器个数。
b. 步长stride：决定滑动多少步可以到边缘。
c. 填充值zero-padding：在外围边缘补充若干圈0，方便从初始位置以步长为单位可以刚好滑倒末尾位置，通俗地讲就是为了总长能被步长整除。

示例过程：

; 激活函数

实际梯度下降中，sigmoid容易饱和、造成终止梯度传递，因为反向传播时求导可能为0，且没有0中心化。咋办呢，可以尝试另外一个激活函数：ReLU，其图形表示如下

ReLU的优点是收敛快，求梯度简单。

池化层

作用减小数据大小，有平均池化和最大赤化

上图所展示的是取区域最大，即上图左边部分中左上角2×2的矩阵中6最大，右上角2×2的矩阵中8最大，左下角2×2的矩阵中3最大，右下角2×2的矩阵中4最大，所以得到上图右边部分的结果：6 8 3 4。很简单不是？

; 全连接层

采用softmax全连接，得到的激活值即卷积神经网络提取到的图片特征。

不同的卷积核会得到不同的效果

在下图对应的计算过程中，输入是一定区域大小(width*height)的数据，和滤波器filter（带着一组固定权重的神经元）做内积后等到新的二维数据。

具体来说，左边是图像输入，中间部分就是滤波器filter（带着一组固定权重的神经元），不同的滤波器filter会得到不同的输出数据，比如颜色深浅、轮廓。相当于如果想提取图像的不同特征，则用不同的滤波器filter，提取想要的关于图像的特定信息：颜色深浅或轮廓。

如下图所示

; 三、手写数字数据集代码

数据集查看

数据集分析

使用keras.datasets库的mnist.py文件中的load_data方法加载数据

import tensorflow as tf
mnist=tf.keras.datasets.mnist

(X_train, Y_train), (X_test, Y_test) = mnist.load_data()

print(X_train.shape,Y_train.shape,X_test.shape,Y_test.shape)

结果

训练集共有60000个样本，测试集共有10000个样本，每个图片样本的像素大小是2828的单通道灰度图(单通道图每个像素点只能有有一个值表示颜色，每个像素取值范围是[0-255])。X_train(储存样本数量，样本像素行，样本像素列)；Y_trainn 。对此X_train是60000张2828的数据，尺寸是600002828，Y_train是对应的数字，尺寸是60000*1，X_test和Y_test同理。在本报告后文将Y_train以及Y_test称为数字标准答案。

单通道图：俗称灰度图，每个像素点只能有有一个值表示颜色，它的像素值在0到255之间，0是黑色，255是白色，中间值是一些不同等级的灰色。. （也有3通道的灰度图，3通道灰度图只有一个通道有值，其他两个通道的值都是零）

数据集可视化


import matplotlib.pyplot as plt

imgNum = 406

plt.imshow(X_train[imgNum],cmap='gray')

plt.title(Y_train[imgNum])
plt.show()

结果

数据处理


img_rows, img_cols = 28, 28

X_train, X_test = X_train / 255.0, X_test / 255.0

X_train = X_train.reshape(X_train.shape[0], img_rows, img_cols, 1)

X_test = X_test.reshape(X_test.shape[0], img_rows, img_cols, 1)

网络搭建


model = tf.keras.models.Sequential([

    tf.keras.layers.Conv2D(filters=6, kernel_size=(3,3), padding='valid', activation=tf.nn.relu, input_shape=(28,28,1)),

    tf.keras.layers.AveragePooling2D(pool_size=(2,2), strides=(2,2), padding='same'),

    tf.keras.layers.Conv2D(filters=16, kernel_size=(3,3), padding='valid', activation=tf.nn.relu),

    tf.keras.layers.AveragePooling2D(pool_size=(2,2), strides=(2,2), padding='same'),

    tf.keras.layers.Flatten(),

    tf.keras.layers.Dense(units=120, activation=tf.nn.relu),

    tf.keras.layers.Dense(units=84, activation=tf.nn.relu),

    tf.keras.layers.Dense(units=10, activation=tf.nn.softmax)

])
model.summary()

优化器和编译器


adam_optimizer = tf.keras.optimizers.Adam(learning_rate)

model.compile(optimizer=adam_optimizer,
                    loss=tf.keras.losses.sparse_categorical_crossentropy,
                    metrics=['accuracy'])

模型训练


start_time = datetime.datetime.now()

num_epochs = 10
batch_size = 64
learning_rate = 0.001
model.fit(x=X_train, y=Y_train, batch_size=batch_size, epochs=num_epochs)

end_time = datetime.datetime.now()
time_cost = end_time - start_time

查看预测结果

import random

image_index = random.randint(1,100)
pred = model.predict(X_test[image_index].reshape(1,28,28,1))
print(pred.argmax())

plt.imshow(X_test[image_index].reshape(28,28), cmap='Greys')
plt.show()

准确率

print(model.evaluate(X_test,  Y_test, verbose=2))

Original: https://blog.csdn.net/guguo666/article/details/127097895
Author: 一颗西柚子
Title: 深度学习模型理解-CNN-手写数据字代码

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/624924/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

CV【4】：ResNet-34

文章目录前言 1. 配置环境 * 1.1. 导入所需的库 1.2. 下载数据集 – 1.2.1. 准备训练集和验证集 1.2.2. 准备测试集 1.2.3. 下载数据…

人工智能 2023年7月13日
0073
如何使用交叉验证来选择超参数

如何使用交叉验证来选择超参数在机器学习中，超参数是指在训练算法之前需要设置的参数。选择合适的超参数对于模型的性能至关重要，而交叉验证是一种常用的方法来选择最佳的超参数。本文将详细…

人工智能 2024年1月6日
0060
kaldi 声纹识别系统（2）代码解读：基于x-vector

kaldi 声纹识别系统（2）代码解读：基于x-vector 预备知识：常用术语 * 文件脚本名称和文件夹名 – run.pl 0. 流程控制：总成 run.sh *…

人工智能 2023年5月25日
0069
【语音识别入门】Python音频处理示例（含完整代码）

一、读取本地音频数据首先，需要import几个工具包，一个是python标准库中的 wave模块，用于音频处理操作， nump和 matplot提供数据处理函数。 import …

人工智能 2023年7月5日
00154
Dataloader的使用

本文主要使用CIFAR10数据集来讲解Dataloader的使用方法，并写入tensorboard中，可以更好的去查看。在pytorch中如何读取数据主要有两个类，分别是Data…

人工智能 2023年7月21日
0090
机器学习（三）聚类算法

目录一、定义和公式 1. 聚类算法 2. 应用： 3. 聚类算法分类：KMeans，Meanshift，DBSCAN Original: https://blog.csdn.n…

人工智能 2023年6月2日
0081
正交试验案例分析全步骤

一、案例说明 1.案例背景为了研究磁疗对烫伤治疗的消肿效果，某研究所对白鼠进行试验，选取强度（A）、磁疗时间（B）和振动（C）三个因素，部分数据参考如下： 2.分析目的用正交设…

人工智能 2023年7月16日
0057
因为tensorflow版本问题踩得坑：contrib没找到问题

AttributeError: module ‘tensorflow.compat.v1’ has no attribute ‘contrib&…

人工智能 2023年5月25日
0093
anaconda新建的环境如何在jupyter notebook中打开

我的情况：win10电脑，已经安装anaconda,用的自带3.7版的python；我的问题：最近需要安装tensorflow ，在3.7版的python上安装失败，所以打算新创建…

人工智能 2023年5月24日
0069
python机器学习二分类混淆矩阵_读书笔记（11）Logistic 回归分类算法及应用

设想这样一些场景：电商企业想要判断用户是否会选择某种支付方式；金融企业想要将用户划分为不同的信用等级；某件商品在接下来的一个月内是否被销售；根据人体内的某个肿瘤特征，判断其是否为恶…

人工智能 2023年6月18日
0057
Python图像处理

一、简介实现计算机视觉任务的过程中，不可避免地需要对图像进行读写操作以及图像预处理操作，下面介绍两个常用的Python图像处理库：OpenCV和Pillow。 OpenCV全称是…

人工智能 2023年5月26日
0053
MySQL高级SQL语句

目录 1 MySQL高级语句 1.1 SELECT ——显示表格中一个或数个栏位的所有资料 1.2 DISTINCT——不显示重复的资料 1.3 WHERE——有条件查询 1.4 …

人工智能 2023年7月31日
0047
【计算机组成原理】IEEE 754

移码的定义移码=真值+偏置值(使用补码计算) 一般情况下8位移码偏置值为2n-1 十进制(原码)原码反码补码移码-0（-128）1000 00001111 11111000 00…

人工智能 2023年6月28日
0087
机器学习系列(1)_数据分析之Kaggle泰坦尼克之灾

本篇博客通过分析泰坦尼克号事故中乘客的信息，从而得出一些相关关系的判断，并且使用 Python可视化的手段更加具体的展现。注：本篇博客参考资料：1、kaggle入门–泰坦尼克号…

人工智能 2023年6月11日
0089
【Linux】Ubuntu 20.04 深度学习 GPU 环境配置（CUDA Toolkit 11.7 + cuDNN v8.4.1）

文章目录 * – 引言 – 准备 – 安装 – + CUDA Toolkit 11.7 + cuDNN v8.4.1 + Minic…

人工智能 2023年6月17日
00117
分箱方法整理

卡方分箱-一种有监督分箱 1.1 卡方检验卡方检验是对分类数据的频数进行分析的统计方法；用于分析分类变量和分类变量的关系（相关程度）；卡方检验分为优度检验和独立性检验。 1.1….

人工智能 2023年7月16日
00115

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31