神经网络案例

2023年5月25日上午3:53 • 人工智能 • 阅读 52


import numpy as np
import matplotlib.pyplot as plt
plt.rcParams['figure.figsize'] = (7,7)
import tensorflow as tf

from tensorflow.keras.datasets import mnist

from tensorflow.keras.models import Sequential

from tensorflow.keras.layers import Dense, Dropout, Activation,BatchNormalization

from tensorflow.keras import utils

from tensorflow.keras import regularizers

数据加载

首先加载手写数字图像


nb_classes = 10

(X_train, y_train), (X_test, y_test) = mnist.load_data()

print("训练样本初始维度", X_train.shape)
print("训练样本目标值初始维度", y_train.shape)

结果为：

训练样本初始维度 (60000, 28, 28)
训练样本目标值初始维度 (60000,)

数据展示：


for i in range(9):
    plt.subplot(3,3,i+1)

    plt.imshow(X_train[i], cmap='gray', interpolation='none')

    plt.title("数字{}".format(y_train[i]))

效果如下所示：

数据处理

神经网络中的每个训练样本是一个向量，因此需要对输入进行重塑，使每个28×28的图像成为一个的784维向量。另外，将输入数据进行归一化处理，从0-255调整到0-1。


X_train = X_train.reshape(60000, 784)
X_test = X_test.reshape(10000, 784)

X_train = X_train.astype('float32')
X_test = X_test.astype('float32')

X_train /= 255
X_test /= 255

print("训练集：", X_train.shape)
print("测试集：", X_test.shape）

输出为：

训练集： (60000, 784)
测试集： (10000, 784)

此外，我们还需要对目标值进行处理，并将其转换为热编码形式：

[En]

In addition, we also need to process the target value and convert it to the form of hot coding:

实现方法如下所示：


Y_train = utils.to_categorical(y_train, nb_classes)
Y_test = utils.to_categorical(y_test, nb_classes)

模型构建

在这里我们构建只有3层全连接的网络来进行处理：

构建方法如下所示：


model = Sequential()

model.add(Dense(512, input_shape=(784,)))

model.add(Activation('relu'))

model.add(Dropout(0.2))

model.add(Dense(512,kernel_regularizer=regularizers.l2(0.001)))

model.add(BatchNormalization())

model.add(Activation('relu'))
model.add(Dropout(0.2))

model.add(Dense(10))

model.add(Activation('softmax'))

我们通过model.summay来看下结果：

Model: "sequential_6"
_________________________________________________________________
Layer (type)                 Output Shape              Param #
=================================================================
dense_13 (Dense)             (None, 512)               401920
_________________________________________________________________
activation_8 (Activation)    (None, 512)               0
_________________________________________________________________
dropout_7 (Dropout)          (None, 512)               0
_________________________________________________________________
dense_14 (Dense)             (None, 512)               262656
_________________________________________________________________
batch_normalization (BatchNo (None, 512)               2048
_________________________________________________________________
activation_9 (Activation)    (None, 512)               0
_________________________________________________________________
dropout_8 (Dropout)          (None, 512)               0
_________________________________________________________________
dense_15 (Dense)             (None, 10)                5130
_________________________________________________________________
activation_10 (Activation)   (None, 10)                0
=================================================================
Total params: 671,754
Trainable params: 670,730
Non-trainable params: 1,024
_________________________________________________________________

模型编译

设置模型训练使用的损失函数交叉熵损失和优化方法adam，损失函数用来衡量预测值与真实值之间的差异，优化器用来使用损失函数达到最优：


model.compile(loss='categorical_crossentropy', optimizer='adam',metrics=['accuracy'])

模型训练


history = model.fit(X_train, Y_train,
          batch_size=128, epochs=4,verbose=1,
          validation_data=(X_test, Y_test))

训练过程如下所示：

Epoch 1/4
469/469 [==============================] - 2s 4ms/step - loss: 0.5273 - accuracy: 0.9291 - val_loss: 0.2686 - val_accuracy: 0.9664
Epoch 2/4
469/469 [==============================] - 2s 4ms/step - loss: 0.2213 - accuracy: 0.9662 - val_loss: 0.1672 - val_accuracy: 0.9720
Epoch 3/4
469/469 [==============================] - 2s 4ms/step - loss: 0.1528 - accuracy: 0.9734 - val_loss: 0.1462 - val_accuracy: 0.9735
Epoch 4/4
469/469 [==============================] - 2s 4ms/step - loss: 0.1313 - accuracy: 0.9768 - val_loss: 0.1292 - val_accuracy: 0.9777

将损失绘制成曲线：


plt.figure()

plt.plot(history.history["loss"], label="train_loss")

plt.plot(history.history["val_loss"], label="val_loss")
plt.legend()
plt.grid()

将训练的精确度绘制为曲线：

[En]

Draw the accuracy of the training as a curve:


plt.figure()

plt.plot(history.history["accuracy"], label="train_acc")

plt.plot(history.history["val_accuracy"], label="val_acc")
plt.legend()
plt.grid()

另外可通过tensorboard监控训练过程，这时我们指定回调函数：


tensorboard = tf.keras.callbacks.TensorBoard(log_dir='./graph', histogram_freq=1,
                                                write_graph=True,write_images=True)

在进行训练：


history = model.fit(X_train, Y_train,
          batch_size=128, epochs=4,verbose=1,callbacks=[tensorboard],
          validation_data=(X_test, Y_test))

打开终端：


tensorboard --logdir="./"

在浏览器中打开指定的URL，即可查看损耗函数和精度、图形结构等方面的变化。

[En]

Open the specified URL in the browser to view the changes in loss function and accuracy, graph structure, etc.

模型测试


score = model.evaluate(X_test, Y_test, verbose=1)

print('测试集准确率:', score)

结果：

313/313 [==============================] - 0s 1ms/step - loss: 0.1292 - accuracy: 0.9777
Test accuracy: 0.9776999950408936

模型保存


model.save('my_model.h5')

model = tf.keras.models.load_model('my_model.h5')

总结

能够利用tf.keras获取数据集：

load_data()

能够构建多层神经网络

[En]

able to build multi-layer neural networks*

dense,激活函数，dropout,BN层等

能够完成网络培训和评估

[En]

be able to complete network training and evaluation*

fit，回调函数，evaluate, 保存模型

Original: https://blog.csdn.net/qq_43966129/article/details/123030127
Author: 最白の白菜
Title: 神经网络案例

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/512008/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

voc数据集格式转coco数据集格式

做一个项目时，有时候不确定到底那个算法模型在我的数据集上表现最好，所以可能需要跑几个模型然后进行对比分析，但是很多模型对数据集的格式要求不同啊，每次都要被数据转换这个烦人的工作折磨…

人工智能 2023年7月6日
0064
超详细OpenCV之python操作

简介 OpenCV是一款由Intel公司俄罗斯团队发起并参与和维护的一个计算机视觉处理开源软件库，支持与计算机视觉和机器学习相关的众多算法，并且正在日益扩展。 OpenCV-Pyt…

人工智能 2023年7月19日
0044
解决CUDA error: no kernel image is available for execution on the device

1. 电脑配置 GPU 3080 算力8.6CUDA 11.1CUDNN 8.2.0conda 4.9.2python 3.8.5 2. 问题描述首先在pytroch官网根据电脑…

人工智能 2023年6月17日
0094
风控必学，手把手系列—基于时间序列实现坏账预估

较早前，番茄风控有一篇介绍偏长期产品的如何做坏账预估的方法：《基于移动平均ANR算法的各种资产指标》文章里面介绍过如何使用移动平均ANR来计算资产，今天我们再跟大家介绍这种基于时…

人工智能 2023年6月17日
0084
Learning在AI算法中的作用是什么

问题：Learning在AI算法中的作用是什么？在AI算法中，Learning（学习）是指通过从数据中提取模式和规律，以改善算法的性能和准确度的过程。学习的主要目标是使算法能够从…

人工智能 2024年1月1日
0037
多分类学习（OvO、OVR、MVM 原理区别）

多分类问题解决思路，一般来说，用二分类学习器解决多分类问题，基本思想是先拆分后集成，也就是先将数据集进行拆分，然后多个数据集可训练多个模型，然后再对多个模型进行集成。这里所谓集成，…

人工智能 2023年6月30日
0069
【yolov4-tiny】三、NNIE小结

序【yolov4-tiny】一、darknet-＞caffe【yolov4-tiny】二、pytorch-＞onnx-＞caffe 前文使用两种途径将yolov4-tiny转为c…

人工智能 2023年7月14日
0075
（项目笔记）opencv人脸识别

Haar级联： Haar特征：边缘特征，线性特征，中心环绕特征，对角线特征这些特征组合为特征模板，特征模板里有白色和黑色矩形，模板特征即为白色矩形像素和减去黑色矩形像素和。 Ha…

人工智能 2023年6月18日
0067
深度学习：可视化方法（模型可视化，训练过程可视化，特征提取可视化）

0.环境说明 python3.8.5+pytorch 模型结构可视化 1.1 netron step1：在虚拟环境中安装netron pip install netron step…

人工智能 2023年7月27日
0071
如何在Framework中进行模型的持久化和加载

如何在Framework中进行模型的持久化和加载在机器学习中，我们通常需要将训练好的模型保存起来，以便在之后的任务中使用。模型的持久化指的是将训练好的模型保存到磁盘上，而加载则是…

人工智能 2024年1月1日
0047
人工智能实践：Tensorflow笔记 Class 5：卷积神经网络

目录 5.1 卷积计算过程 5.2 感受野 5.3 全零填充 5.4 TF描述卷积计算层 5.5 批标准化 5.6 池化 5.7 舍弃 5.8 卷积神经网络 5.9 CIFAR…

人工智能 2023年5月25日
0082
三维目标检测之OpenPCDet环境配置及demo测试

很久没写过关于环境配置的博客了，这次实在是因为，自己在是在OpenPCDet环境的配置上遇到坑了。一环扣一环，由于我的实验环境是ubuntu16.04，跟网上大多数教程环境不一样，…

人工智能 2023年6月17日
0091
Python建立线性回归模型进行房价预测

Python建立线性回归模型进行房价预测前期准备多因子房价预测 * 实战流程 – 1.数据加载 2.数据可视化 3.数据预处理 4.模型建立与训练 5.模型预测 6…

人工智能 2023年6月15日
00112
机器学习——L1和L2正则化对回归模型的影响

《机器学习：公式推导与代码实践》鲁伟著读书笔记。回归模型拓展对于回归模型来说，目标变量有许多影响因素。但是这么多影响因素之中，总有少数关键因素对目标变量的变化起着重要的影响。面…

人工智能 2023年6月18日
0086
机器学习：KL散度详解

KL 散度，是一个用来衡量两个概率分布的相似性的一个度量指标。我们知道，现实世界里的任何观察都可以看成表示成信息和数据，一般来说，我们无法获取数据的总体，我们只能拿到数据的部分样…

人工智能 2023年6月26日
0092
pycharm安装与pytorch环境配置

pycharm安装与pytorch环境配置 Pycharm简介 Pycharm下载 Pytorch简介 Pytorch下载安装 Pycharm简介 PyCharm是一种Python…

人工智能 2023年5月28日
00112

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

神经网络案例

目录

数据加载

数据处理

模型构建

模型编译

模型训练

模型测试

模型保存

总结

大家都在看