人工智能导论–基于神经网络的模式识别实验

2023年7月27日下午1:42 • 人工智能 • 阅读 55

实验3 基于神经网络的模式识别实验

一、实验目的：

理解BP神经网络和卷积神经网络的结构和原理，掌握反向传播学习算法对神经元的训练过程，了解反向传播公式。通过构建BP神经网络和卷积神经网络模式识别实例，熟悉前馈神经网络的原理、结构和工作过程。

二、实验原理

BP学习算法是通过反向学习过程使误差最小，其算法过程从输出节点开始，反向地向第一隐含层(即最接近输入层的隐含层)传播由总误差引起的权值修正。BP网络不仅含有输入节点和输出节点，而且含有一层或多层隐(层)节点。输入信号先向前传递到隐节点，经过作用后，再把隐节点的输出信息传递到输出节点，最后给出输出结果。

卷积神经网络的人工神经元可以响应一部分覆盖范围内的周围单元。卷积神经网络由三部分构成：第一部分是输入层，第二部分由 _n_个卷积层和池化层的组合组成，第三部分由一个全连接的多层感知机分类器构成。这一结构使得卷积神经网络能够利用输入数据的二维结构。卷积神经网络会自动的对于一张图片学习出最好的卷积核以及这些卷积核的组合方式，然后来进行判断。

三、实验条件：

自主安装64位的python 3.6以上，以及TensorFlow2.0以上、numpy、matplotlib、pylab等第三方库，新建一个文件夹datasets （C:\Users\A.keras\datasets），把mnist.npz放入datasets文件夹里。

四、实验内容：

1.分析Mnist数据集，选择55000个训练样本、5000个验证样本、10000个测试样本，设置批量大小为100。

2.设计一个含有2个隐层的BP网络结构模型，输出层采用sofmax回归后的交叉熵损失函数，设置学习率、训练步数、批数等参数，给出训练和测试结果，分别填入下表1。（注：下表1 中？和空白区域都需要补充完整）

表1 BP网络的参数及训练、测试结果

参数

隐层数

隐层激活函数

隐层神经元数

学习算法

训练结果（训练损失值、验证正确率）

测试正确率

批量大小：100

学习率：0.01

训练次数：10

输入神经元数:512

输出神经元数:10

输出激活函数：sofmax回归后的交叉熵

Relu

第1个隐层：

神经元数为：512

参数量为：401920

第2个隐层：

神经元数为：512

参数量为：261656

随机梯度下降+动量法：optimizers.SGD(lr=0.01)

loss: 0.4541553258895874

Acc: 0.9074

Test Acc: 0.8866

Adagrad算法：

optimizers.Adagrad(lr=0.01)

loss: 0.0027855050284415483

Acc: 0.984

Test Acc: 0.9819

Adam算法：optimizer=optimizers.Adam(lr=0.01)

Loss:

0.17099925875663757

ACC=0.972

TEST ACC=0.9636

3.对于含有4个（含有512个神经元）隐层的BP网络结构模型，隐层激活函数采用relu，学习算法采用Adam算法，设计并比较不同模型的正确率，把训练和测试结果填入下表2。（注：下表2 中？和空白区域都需要补充完整）

表2 含4个隐层的BP网络训练、测试结果

不同模型

训练结果（训练损失值、验证正确率）

测试正确率

使用指数衰减学习率：

初始学习率=0.01

衰减系数=0.96

衰减步数=1000

loss: 0.0005220939638093114

Acc: 0.9766

Test Acc: 0.9776

只使用正则化，学习率固定：

学习率=0.01

正则化系数=0.001

loss: 0.17735381424427032

Acc: 0.971

Test Acc: 0.9676

使用指数衰减学习率和正则化：

正则化系数=0.001

初始学习率=0.01

衰减系数=0.96

衰减步数=1000

loss: 0.02895130217075348

Acc: 0.9806

Test Acc: 0.9793

只使用Dropout，学习率固定：

学习率=0.01

Dropout断开率=0.5

loss: 0.1732

Acc: 0.967

Test Acc: 0.958

对Mnist数据集，选择55000个训练样本、5000个验证样本、10000个测试样本，设置批量大小为100。然后构建一个卷积神经网络模型，把卷积神经网络的结构模型参数填入表3，隐层激活函数采用relu，选择学习算法，设置参数，把不同模型的训练和测试结果填入下表4。（注：表3中，名称填输入层、卷积层、池化层、全连接层、输出层；表4中的BP神经网络采用含有4个隐层（每层含有512个神经元，激活函数采用relu ）的网络结构模型）

表3 卷积神经网络的结构模型参数

名称

神经元个数

过滤器尺寸

卷积核个数

步长

激活函数

填充数

输出特征图大小

第1层

卷积层1

62626

3*3

Relu

26*26

第2层

池化层1

–

2*2

Relu

13*13

第3层

卷积层2

161111

3*3

Relu

11*11

第4层

池化层2

–

2*2

Relu

5*5

第5层

全连接层1

120

–

Relu

–

第6层

全连接层2

–

Relu

–

第7层

全连接层3

–

Relu

–

表4卷积神经网络和BP神经网络的训练、测试结果

学习算法及参数设置

不同模型

训练结果（训练损失值、验证正确率）

测试正确率

学习率为0.01

学习算法为 Adam

使用正则化的卷积神经网络

(正则化系数=0.001)

loss: 0.10340672731399536

Acc: 0.9824

Test Acc: 0.9799

使用正则化的BP神经网络

(正则化系数=0.001)

loss: 0.17735381424427032

Acc: 0.971

Test Acc: 0.9676

五、实验报告要求：

1 ． 按照实验内容，给出相应结果。

2．分析比较不同学习算法对BP网络的训练结果、测试结果等的影响。

①随机梯度下降的算法是训练速度最快的，同时也是准确率最低的，训练结果和测试结果的准确率都不是很高。代价函数也最大，为0.4541553258895874，比其他两种算法都高很多，说明其模型拟合的不好。因为它是盲目搜索，是随机抽取的一个样本，信息少，容易跑偏。

②Adagrad算法性能是三种里面最好的，无论是训练效果还是测试效果都是准确率最高的，代价函数的值也是远远小于其他两种算法，可以从结果看Adagrad算法并没有发生严重的过拟合现象。

③Adam算法优化，也可以提高训练结果和测试结果的准确度，但没有Adagrad算法准确度高。

3. 分析比较使用指数衰减学习率、正则化和Drop层等不同模型对于训练结果、测试结果等的影响。

①使用指数衰减学习率提高了训练结果和测试结果的准确度，但提升的程度不明显，但是代价函数小了很多。

②使用正则化后，可以比较好的解决过拟合的问题，这边的loss值比不使用时大了一点，但是从准确度上来说模型拟合的性能并没有提高多少。

③使用droout层，也是和使用正则化一样的效果，它对于神经网络单元按照一定的概率将其暂时从网络中丢弃，从而提升训练效果，但是在本实验中不太明显，本实验是只在第3层加dropout层，如下：

network = Sequential([layers.Dense(512, activation=’relu’),

layers.Dense(512, activation=’relu’),

layers.Dropout(0.5),

layers.Dense(512, activation=’relu’),

layers.Dense(10, activation=’softmax’)])

④使用指数衰减学习率和正则化结合的方法比只使用指数衰减学习率的loss值高，说明一定程度上减小了过拟合的效应，但是loss比值使用正则化的loss值高，提升了模型性能，训练结果和测试结果的准确度都提升了。

4. 总结BP网络和卷积神经网络在模式识别方面的异同点。

不同点：

①BP网络和卷积神经网络的计算方法不同：

BP神经网络是一种按照误差逆向传播算法训练的多层前馈神经网络

卷积神经网络则包含卷积计算且具有深度结构的前馈神经网络。

②卷积网络使用共享权值来减少网络各层之间的连接

③BP的网络结构：包括输入层，隐层和输出层。

卷积网络结构：输入层，卷积层，池化层，全连接层，输出层。

④BP采用全连接，卷积网络采用局部感知

相同点：

①BP神经网络和卷积神经网络都属于前馈神经网络，

②输入层都是输入图像，输出层都是多分类的结果。

③网络的中间层数、各层的神经元个数都可以根据具体情况任意设定，并且随着结构的差异其性能也有所不同。

④都采用了前向传播计算输出值，反向传播调整权重和偏置。

5. 实验心得。

①掌握了卷积层中输入大小和输出大小之间的计算关系：

输入：rxc，卷积核：axb，步长stride：s=1 输出：长=(r-a)/s+1 ，宽 =(c-b) )/s +1

②掌握了训练参数的计算

③掌握了BP和卷积网络的搭建和和优化算法的使用及训练和预测

代码（例：4层指数衰减）：

import  tensorflow as tf
from    tensorflow.keras import datasets, layers, optimizers, Sequential
import matplotlib.pyplot as plt
import numpy as np
import pylab

def preprocess(x, y):
    x = tf.cast(x, dtype=tf.float32) / 255.

    y = tf.cast(y, dtype=tf.int32)
    return x,y

(x, y), (x_test, y_test) = datasets.mnist.load_data()#&#x4E0B;&#x8F7D;&#x6216;&#x8BFB;&#x53D6;&#x6570;&#x636E;&#x96C6;
print('datasets:', x.shape, y.shape, x.min(), x.max())#&#x6253;&#x5370;

训练：

imgs = x_test[0:5]#选取第0到5的图片
labs = y_test[0:5]
#print(labs)
plot_imgs = np.hstack(imgs)#将五张图片拼接成一行
plt.imshow(plot_imgs, cmap='gray')#选择gray灰度图
#pylab.show()#显示测试图片

x_train,x_val=tf.split(x,num_or_size_splits=[55000,5000])
y_train,y_val=tf.split(y,num_or_size_splits=[55000,5000])

batchsz = 100#设置批量大小

db = tf.data.Dataset.from_tensor_slices((x_train,y_train))
db = db.map(preprocess).shuffle(55000).batch(batchsz).repeat(10)
db_test = tf.data.Dataset.from_tensor_slices((x_test,y_test))
db_test = db_test.map(preprocess).batch(batchsz)
ds_val = tf.data.Dataset.from_tensor_slices((x_val, y_val))
ds_val = ds_val.map(preprocess).batch(batchsz)

#构建网络模型
network = Sequential([layers.Dense(512, activation='relu'),
                      layers.Dense(512, activation='relu'),
                      layers.Dense(512, activation='relu'),
                      layers.Dense(512, activation='relu'),
                      layers.Dense(10,  activation='softmax')])
network.build(input_shape=(batchsz, 28*28))#批量大小
network.summary()                       #打印网络参数
设置优化器
exponential_decay=tf.keras.optimizers.schedules.ExponentialDecay(
          initial_learning_rate=0.01,decay_steps=1000,decay_rate=0.96)

optimizer=tf.keras.optimizers.Adam(exponential_decay)

#optimizer = optimizers.Adam(lr=0.01)    # 固定学习率的Adam学习算法，大块=快，会振荡
#optimizer = = optimizers.SGD(0.01, decay=1e-2)# 固定学习率的SGD学习算法

#分批进行训练
for echo in range(10):
    for step, (x,y) in enumerate(db):#从训练集读取一批样本数据
        with tf.GradientTape() as tape:#构建梯度训练环境
            # [b, 28, 28] => [b, 784]
            x = tf.reshape(x, (-1, 28*28))
            # [b, 784] => [b, 10]
            out = network(x,training=True)
            # [b] => [b, 10]
            y_onehot = tf.one_hot(y, depth=10)
            # [b]
            #计算交叉熵损失函数
            loss = tf.reduce_mean(tf.losses.categorical_crossentropy(y_onehot, out, from_logits=False))

        grads = tape.gradient(loss, network.trainable_variables)#计算梯度
        optimizer.apply_gradients(zip(grads, network.trainable_variables))#更新训练参数
        if step % 100 == 0:
            print('echo=',echo,' step=',step, 'loss:', float(loss))#打印训练的损失函数

        # 模型评价
        if step % 500 == 0:
            total, total_correct = 0., 0
            for i, (x, y) in enumerate(ds_val):
                # [b, 28, 28] => [b, 784]
                x = tf.reshape(x, (-1, 28*28))
                # [b, 784] => [b, 10]
                out = network(x)#神经网络模型输出
                # [b, 10] => [b]
                pred = tf.argmax(out, axis=1)
                pred = tf.cast(pred, dtype=tf.int32)
                # bool type
                correct = tf.equal(pred, y)
                # bool tensor => int tensor => numpy
                total_correct += tf.reduce_sum(tf.cast(correct, dtype=tf.int32)).numpy()
                total += x.shape[0]
            print(' step=',step, 'Evaluate Acc:', total_correct/total)#打印模型验证正确率

print("train is over")

#测试模型
total, total_correct = 0., 0
for i, (x, y) in enumerate(db_test):#读取一批测试数据
    # [b, 28, 28] => [b, 784]
    x = tf.reshape(x, (-1, 28*28))
    # [b, 784] => [b, 10]
    out = network(x)#神经网络模型输出
    # [b, 10] => [b]
    pred = tf.argmax(out, axis=1)
    pred = tf.cast(pred, dtype=tf.int32)
    # bool type
    correct = tf.equal(pred, y)
    # bool tensor => int tensor => numpy
    btestacc=tf.reduce_sum(tf.cast(correct, dtype=tf.int32)).numpy()
    total_correct += btestacc
    total += x.shape[0]
    #print('第',i,'批','test acc=',btestacc/x.shape[0])
    #print(y)
    #print(pred)
print('Test Acc:', total_correct/total)

训练结果：

Original: https://blog.csdn.net/cangzhexingxing/article/details/124123719
Author: 猫猫爱吃小鱼
Title: 人工智能导论–基于神经网络的模式识别实验

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/718477/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Yolov7模型训练与部署

背景在工业上使用较多的基于深度学习从目标检测算法，那毫无疑问应该是yolo，凭借这效率和精度方面的优势，在一众深度学习目标检测算法中脱颖而出。目前最新的版本是yoloV7，根据y…

人工智能 2023年7月26日
00103
如何下载 International Conference on Machine Learning（ICML）顶会的论文？从哪找ICML顶会论文？如何判断会议和期刊级别？

之前费了老长时间都找不到ICML会议的论文，我有找过ACM数据库，但是ACM数据库只有2009年以前的论文集，就很离谱，今天终于被我找到了下载ICML会议的方法，不光ICML会议的…

人工智能 2023年6月17日
00100
Anaconda安装及配置（详细版）

1. 前言第一次下载Anaconda往往会出现一些问题，比如不知道如何下载，或者下载过慢等问题，由此本文给出以下解决放方案，并给出图示解决。 2. 下载anaconda 首先下载…

人工智能 2023年7月4日
0097
硬件模块的二次开发——YS-LDV7语音模块的二次开发

1.YS-LDV7语音模块：工作电压：5V通信方式：串口通信单片机型号：STC11L08XE 2.源码修改：（1）使用 Keil uVision4 进行修改，打开 code：（…

人工智能 2023年5月27日
00129
GCN、GAT实现Cora数据集节点分类（pytorch-geometric框架）

Cora数据集介绍下载地址：https://linqs-data.soe.ucsc.edu/public/lbc/cora.tgz Cora数据集由深度学习论文组成，论文表示为…

人工智能 2023年7月2日
00117
[机器学习与scikit-learn-22]：算法-聚类-无监督学习与聚类基本原理

作者主页(文火冰糖的硅基工坊)：文火冰糖（王文兵）的博客_文火冰糖的硅基工坊_CSDN博客本文网址：https://blog.csdn.net/HiWangWenBing/art…

人工智能 2023年6月3日
0073
excel第一天-数据分析与Excel

数据分析与Excel 1. 数据分析随着互联网+的不断深入，网络中的数据量飞速膨胀。身处信息的海洋，在这个数据高速爆发的时代，企业想要快速发展，不能只简单地靠历史的经验，想要快速…

人工智能 2023年7月15日
0072
CAD绘图软件：BricsCAD

Original: https://www.cnblogs.com/aurora-123/p/16736933.htmlAuthor: 佛系女孩Title: CAD绘图软件：Bri…

人工智能 2023年6月3日
0067
【Python数据分析】实践编写篇2：用Python进行回归分析与相关分析

目录一、前言 1.1 回归分析 1.2 相关分析二、代码的编写 2.1 前期准备 2.2 编写代码 2.2.1 相关分析 2.2.2 一元线性回归分析 2.2.3 多元线性回归…

人工智能 2023年6月16日
0096
动手实现深度学习（12）：卷积层的实现与优化（img2col）

卷积的计算过程网上的资料已经做够好了，没必要自己再写一遍。只把资料搬运到这里：这里总结一下有padding\stride的卷积操作: 假设，输入大小为（H,W,C）,filete…

人工智能 2023年6月4日
0040
C/C++常用预编译指令介绍

目录 1、#include指令 2、#define和#undef指令 3、#ifdef、#ifndef、#else、#elif和#endif指令 4、#error指令 5、编译器预…

人工智能 2023年5月30日
0072
Python实现人脸识别功能，face_recognition的使用 | 机器学习

前言接着上一篇：AI识别照片是谁，人脸识别face_recognition开源项目安装使用 | 机器学习_阿良的博客-CSDN博客根据项目提供的demo代码，调整了一下功能，自…

人工智能 2023年6月4日
0076
深度学习YOLOv4模型简单部署，flask框架搭建以及web开发

一.深度学习模型的部署相信很多人在训练深度学习模型之后不知道如何将训练好的模型部署到服务端，这里我们提出一个想法，用Flask来搭建一个框架，Flask就不在这里进行详细讲解了，…

人工智能 2023年5月23日
0065
Python：Pandas创建Dataframe数据框的六种方法

创建 Dataframe主要是使用 pandas中的 DataFrame函数，其核心就是第一个参数： data，传入原始数据，因此我们可以据此给出六种创建 Dataframe的方法…

人工智能 2023年7月6日
0048
总结各种神经网络的用处

总结各种神经网络的用处深度神经网络DNN 卷积神经网络CNN 生成对抗网络GAN 循环神经网络RNN 作为一个深度学习的初学者，琳琅满目的神经网络算法让人”学不胜学&…

人工智能 2023年7月14日
00112
卷积层中的步幅（stride）是什么？如何选择合适的步幅

问题描述卷积层是卷积神经网络（CNN）中的一种重要的层级结构，用于提取输入数据的特征。在卷积层中，步幅（stride）是一个重要的超参数，它决定了卷积核在输入数据上滑动的距离。本…

人工智能 2024年1月1日
0048

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

人工智能导论–基于神经网络的模式识别实验

大家都在看