详解神经网络的过程

2023年7月14日上午7:26 • 人工智能 • 阅读 55

之前我们知道用卷积神经网络做图片识别

https://ieeexplore.ieee.org/document/726791/citations#citations

可是卷积神经网络是怎么工作的呢？
本文专门完整走一边神经网络，看看数据都发生了什么变化。

需要用到的库有tensorflow、matplotlib和cv2

import tensorflow as tf
import matplotlib.pyplot as plt
import cv2

读取图片

首先我们读取一张图片，然后改成320×320的尺寸

img = cv2.imread('doll.png')
b,g,r = cv2.split(img)
img = cv2.merge([r,g,b])
img = cv2.resize(img, (320, 320))
img = img / 255.0

可以查看一下图片是一个320×320×3的数组

array([[[0.6627451 , 0.67843137, 0.6745098 ],
        [0.6627451 , 0.67843137, 0.6745098 ],
        [0.6627451 , 0.67843137, 0.6745098 ],
        ...,
        [0.49019608, 0.49019608, 0.48235294],
        [0.49803922, 0.48235294, 0.47843137],
        [0.49803922, 0.48235294, 0.47843137]],

       [[0.6627451 , 0.68627451, 0.67843137],
        [0.6627451 , 0.68627451, 0.67843137],
        [0.6627451 , 0.68627451, 0.67843137],
        ...,
        [0.49019608, 0.49019608, 0.48235294],
        [0.49019608, 0.48627451, 0.47843137],
        [0.49019608, 0.48627451, 0.47843137]],

       [[0.6627451 , 0.69019608, 0.69019608],
        [0.6627451 , 0.68627451, 0.68627451],
        [0.6627451 , 0.68627451, 0.68627451],
        ...,
        [0.49019608, 0.49019608, 0.48235294],
        [0.49019608, 0.48627451, 0.47843137],
        [0.49019608, 0.48627451, 0.47843137]],

       ...,
...

        [0.6627451 , 0.67843137, 0.6745098 ],
        ...,
        [0.32156863, 0.25098039, 0.20392157],
        [0.31764706, 0.24705882, 0.2       ],
        [0.31372549, 0.24313725, 0.19607843]]])

cv2的功能比较多，比如改变尺寸，如果不需要，只用自带的函数就可以完成

在matplatlib里面显示一下为

plt.imshow(img)
plt.show()

卷积神经网络

现在我们就把这张图片输入一下神经网络模型，看看每一步的变化。

卷积

总共如下重要参数

https://tensorflow.google.cn/api_docs/python/tf/keras/layers/Conv2D

filters: 输出空间的维度
kernel_size: 卷积核的宽高，可以数组或者元祖，如果宽高一样可以是一个整数
strides: 步长，卷积在宽高的步长
padding: 边界，string类型的SAME或VALID，不区分大小写，SAME代表了上下左右的边界补0，VALID代表没有边界
activation: 激活函数，一般使用ReLU作为激活函数
dilation_rate: 膨胀率，卷积中间补0，膨胀率和步长不能同时大于1

tf.keras.backend.set_floatx('float64')
conv1 = tf.keras.layers.Conv2D(16, 2, input_shape=(320,320,3))
img_conv1 = conv1(tf.reshape(img, (1, 320, 320, 3)))

正常应该是输入一组320×320×3的图片
现在虽然只有一张也是要放入一个数组中所以reshape(1, 320, 320, 3)

输入的刚才的img，也就是320×320的三通道的1张图片

因为 filters=16，所以输出了16张图片

卷积核是2×2，所以320×320变成了319×319

TensorShape([1, 319, 319, 16])

注意，之前的3代表的是RGB三通道，现在的16代表了16个不同的卷积后的图片

返回的319×319的16张图片如下

我们修改一下参数，现在把kernel_size设置为4，步长设置为2，并且增加了relu为激活函数

conv2 = tf.keras.layers.Conv2D(16, 4, 2, activation=tf.nn.relu)
img_conv2 = conv2(img_conv1)
fig, axes = plt.subplots(4, 4, figsize=(6,6))
for m in range(4):
  for n in range(4):
    axes[m, n].imshow(img_conv2[0,:,:,m*4 + n])
plt.show()

TensorShape([1, 158, 158, 16])

图如下

因为步长为2，所以尺寸从之前的319减少到了158，少了一半

因为设置了relu激活函数，所以很多数据没到阈值直接变成0，所以很多图片直接”黑”了，因为0是黑色

池化

池化是为了防止过拟合，表现效果就是尺寸更小

pool1 = tf.keras.layers.MaxPool2D()
img_pool1 = pool1(img_conv2)
fig, axes = plt.subplots(4, 4, figsize=(6,6))
for m in range(4):
  for n in range(4):
    axes[m, n].imshow(img_pool1[0,:,:,m*4 + n])
plt.show()
img_pool1.shape

TensorShape([1, 79, 79, 16])

池化之后从之前的158降低到了79

如图

再来一次卷积和池化，并且把深度加到64

conv3 = tf.keras.layers.Conv2D(32, 2, activation='relu')
img_conv3 = conv3(img_pool1)
conv4 = tf.keras.layers.Conv2D(64, 2, activation='relu')
img_conv4 = conv4(img_conv3)
pool2 = tf.keras.layers.MaxPool2D()
img_pool2 = pool2(img_conv4)
fig, axes = plt.subplots(8, 8, figsize=(8,8))
for m in range(8):
  for n in range(8):
    axes[m, n].imshow(img_pool2[0,:,:,m*8 + n])
plt.show()
img_pool2.shape

压平

现在要把38×38×64的三维向量拉平，变成一维向量，计算机算的数据最好是一维

img_flatten = tf.keras.layers.Flatten()(img_pool2)
img_flatten.shape

TensorShape([1, 92416])

全链接

最后使用dense创建选链接，unit设置为多少就会变成多少个数据

img_dense1 = tf.keras.layers.Dense(32, activation=tf.nn.relu)(img_flatten)
img_dense1.shape

TensorShape([1, 32])

比如最终的图片分类是10个，那么最终就设置10个单位，一般留一个梯度，缓缓下降到最终的单位

cls = tf.keras.layers.Dense(10, activation=tf.nn.softmax)(img_dense1)
cls

可以看到，cls中的10个数据，就代表了每一个分类的概率

<tf.tensor: shape="(1," 10), dtype="float64," numpy="array([[0.0998901" , 0.09763801, 0.09610229, 0.10639109, 0.12393067, 0.08850211, 0.09905299, 0.08858827, 0.10362383, 0.09628064]])>
</tf.tensor:>

可以看到标签4的几率高一些

因为没有训练，数据比较平均

源代码：https://gitee.com/thales-ucas/deep-learning/blob/main/cnn.ipynb

Original: https://blog.csdn.net/minamto/article/details/124202495
Author: 源霓码
Title: 详解神经网络的过程

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/691577/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

fNIRS功能近红外数据处理服务

在脑科学和神经科学领域，功能近红外成像技术（functionalnear-infrared spectroscopy, fNIRS）已经逐渐成为研究大脑活动的重要技术手段之一。该技…

人工智能 2023年7月15日
0085
一篇文章让你学会绘画十一种常见数据分析图（折线图，直方图，散点图，雷达图等等）

本篇博文主要内容ython Pyplot中的十一个常用绘图，包括参数说明，代码，运行结果。有问题可以+Q180096010一起交流学习~ 目录1. 折线图plt.plot绘制折线图…

人工智能 2023年7月14日
0068
python ndarray转换为array_python ndarray与pandas series相互转换，ndarray与dataframe相互转换…

用python做科技计算时，经常需要类型转换，以下是常用类型转换一、ndarray 转换为 series 1、如果ndarray是二维数组，如下 array([[1], [2],…

人工智能 2023年7月6日
0070
DEseq2 差异分析基本原理

DEseq简介寻找组间显著表达变化的基因，以解释基因表达水平的变化对生物功能的变化最直接的办法就行进行转录组测序和定量。那如何从不同组定量的转录组寻找到那些显著差异的基因呢？DE…

人工智能 2023年6月19日
0090
强化学习之stable_baseline3详细说明和各项功能的使用

本文基于官方文档的基础上，把其中的重要部分整合和翻译，并整理成容易理解的顺序。其中蕴含有大量使用案例，方便大家理解和查看。官方文档：https://stable-baseline…

人工智能 2023年7月26日
00252
tensorflow–学习笔记–莫烦python

1.处理结构 input——-包含x-input和y-input gradient descent–梯度下降—更新数据–…

人工智能 2023年5月25日
0083
Tensorflow+Win10实现DGCNN代码

今天给大家讲解一下如何成功调试DGCNN的代码，之前发的博客是关于PointNet的代码调试，它们两个的网络非常类似，只不过DGCNN结合了局部的特征信息，关系到了点领域之间的关系…

人工智能 2023年5月24日
0069
目标检测网络 — FasterRCNN

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档 FasterRCNN知识点一、卷积层–backbone特征提取网络二、RPN网络三、ROI Po…

人工智能 2023年7月10日
0071
3D视觉——2.人体姿态估计(Pose Estimation)入门——OpenPose含安装、编译、使用（单帧、实时视频）

上一话 3D视觉——1.人体姿态估计(Pose Estimation)入门——使用MediaPipe含单帧(Signel Frame)与实时视频(Real-Time Video)h…

人工智能 2023年5月26日
0072
京东面试题：ElasticSearch深度分页解决方案

前言 Elasticsearch 是一个实时的分布式搜索与分析引擎，在使用过程中，有一些典型的使用场景，比如分页、遍历等。在使用关系型数据库中，我们被告知要注意甚至被明确禁止使用…

人工智能 2023年6月28日
0078
tensorflow2调用huggingface transformer预训练模型

tensorflow2调用huggingface transformer预训练模型一点废话 * huggingface简介传送门 pipline 加载模型设定训练参数数据预…

人工智能 2023年5月26日
0082
【强化学习】Q-Learning算法详解以及Python实现【80行代码】

在文章正式开始前，请不要被强化学习的tag给吓到了，这也是我之前所遇到的一个困扰。觉得这个东西看上去很高级，需要一个完整的时间段，做详细的学习。相反，强化学习的很多算法是很符合直观…

人工智能 2023年6月23日
0072
【cartographer_ros】七：主要配置参数说明

上一节介绍了路标Landmark数据的订阅和发布，各类数据的发布和订阅基本阐述完毕。本节会介绍cartographer的主要配置参数，研究这些参数的使用和对算法的影响。首先还是…

人工智能 2023年6月4日
00102
python绘制散点图

前言散点图是指在回归分析中，数据点在直角坐标系平面上的分布图，散点图表示因变量随自变量而变化的大致趋势，据此可以选择合适的函数对数据点进行拟合。用两组数据构成多个坐标点，考察坐…

人工智能 2023年7月5日
0050
学习笔记4-卷积操作（附相关代码）、channels含义（in_channels、卷积channels、out_channels）

** torch.nn模块包含torch已经准备好的卷积层、归一化层、池化层、激活函数层、全连接层。 4.1卷积层 4.1.1卷积核使用操作：二维卷积运算过程示意图如下图所示：相信…

人工智能 2023年7月23日
0088
关于CUDA和cuDNN的介绍说明及TensorFlow的GPU支持

一、简介 CUDA ®是英伟达发明的并行计算平台和编程模型。通过利用图形处理单元 (GPU) 的强大功能，它可以显着提高计算性能。 NVIDIA CUDA 深度神经网络 (cuDN…

人工智能 2023年5月25日
0095

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

详解神经网络的过程

卷积

池化

压平

全链接

大家都在看