深度学习-基于(Pytorch)卷积神经网络对多分类实验分析

2023年7月13日上午5:53 • 人工智能 • 阅读 83

1．1主要研究内容

本次实验利用CNN对类别数据集进行分类，并掌握卷积神网络搭建的过程，了解卷积模块，池化模块，Batch Normalization模块，激活函数等各个模块的原理，以及对图像进行卷积操作，池化操作等计算方法与过程；对每次训练损失进行可视化，不断调整参数，例如优化器的选取、学习率等；通过混淆矩阵来评判分类结果好坏。
该实验所需的类别数据集

1．2 数据集描述

实验使用的类别数据集有6400张大小不统一的彩色图片，这些彩色图片归属八个类别，该类别包括猫、狗、飞机、花、水果、摩托车、汽车、人；每个类别含有800张图片。在整个数据集中，采用随机分配原则，按3：1来分为训练集和测试集。
通过数据集可以观察处，每个类别与之对应大小不一样，在其训练和测试过程要先对数据集进行处理统一裁剪成128X128大小，其每个类别（未裁剪）下图片如下：

; 1．3 特征提取过程描述

卷积具有旋转不变性和平移不变性特点，图像可以看成带有数值的矩阵，利用卷积核与图像矩阵做卷积操作，提取对应特征的特征向量；而且卷积神经网络有局部连接的特点，也就是每个卷积核都与之对应图像某块区域的特征，而在后续更深度卷积提取特征时，这块区域的卷积核权值共享，在进行误差反向传播更新权重也针对某块区域对应的卷积核。

1．4 分类过程描述

对于多分类问题，采用softmax分类进行分类；这个分类器封装于nn.CrossEntropyLoss()中，其结构如下图所示：

本次实验要分成8类，在经过卷积神经网络提取完特征后，经最后一个全连接层得到类别的得分，此时再送到softmax分类器转成概率问题，得出与之对应的概率值大小，也等同与预测的标签；上图的右半部分损失的计算是那预测与真实标签(-预测log真实)，分类的正确最后以one-hot向量来展示出来。

; 1．5 主要程序代码

此次代码主要分为三个部分，第一部分是数据集的制作，把八类图片统一裁剪成相同大小；第二部分是网络的搭建，网络的搭建参考谷歌的Inception模块；第三部分是训练与测试，并用混淆矩阵来评判分类的好坏。
第一部分，统一裁剪成128X128，默认黑色填充；通过PIL模块下的裁剪函数thumbnail()和python自带函数paste将裁剪后的图像以复制方式存入新的类别文件里。

def resize_image(src_image,size=(128,128),bg_color="black"):
    src_image.thumbnail(size,Image.ANTIALIAS)
    new_image = Image.new("RGB",size,bg_color)
    new_image.paste(src_image,(int((size[0] - src_image.size[0]) / 2),
                               int((size[1] - src_image.size[1]) / 2)))
    return new_image

第二部分，网络搭建。参考谷歌的Inception模块进行网络的搭建，以堆叠两个为例开始搭建。参考的模块图如下：

与之对应的代码如下：
第一个Inception

self.branch1 = nn.Sequential(nn.MaxPool2d((2,2),1,padding=1)
                                     ,nn.Conv2d(16,16,1),nn.ReLU())
        self.branch2 = nn.Sequential(nn.Conv2d(16,16,1),nn.ReLU())
        self.branch3 = nn.Sequential(nn.Conv2d(16,16,1),
                                     nn.Conv2d(16,16,3,padding=1,bias=False),nn.BatchNorm2d(16),nn.ReLU())
        self.branch4 = nn.Sequential(nn.MaxPool2d((3,3),1,padding=1),
                                     nn.Conv2d(16,16,1),
                                     nn.Conv2d(16,16,3,padding=1,bias=False),nn.BatchNorm2d(16),nn.ReLU())

第二个Inception：

self.branch2_1 = nn.Sequential(nn.MaxPool2d((3,3),1,padding=1)
                                       ,nn.Conv2d(32,32,1),nn.ReLU())
        self.branch2_2 = nn.Sequential(nn.Conv2d(32,32,1),nn.ReLU())
        self.branch2_3 = nn.Sequential(nn.Conv2d(32,16,1),
                                       nn.Conv2d(16,32,3,padding=1,bias=False),nn.BatchNorm2d(32),nn.ReLU())

与之对应两个Inception模块可视化如下：

第一个Inception

第二个Inception

第三部分，训练与测试
首先，将处理好的数据集按4：1进行划分，训练4份，测试1份。其次，多类图片特征混杂，利用卷积旋转，平移不变的特点对数据集进行增强，并进行归一化操作。接下来，按批次进行带入模型开始训练，并在训练完后一个epoch进行测试。
总体流程：利用迭代器送入数据，梯度更新；数据导入模型；利用交叉熵计算损失；反向传播更新误差；优化器更新。
测试：采用Softmax分类器进行分类，选出概率最大的标签与真实标签来计算损失，并将预测正确的图片进行累加与测试集来求准确率。

def train(model,train_loader,optimizer,epoch):
    model.train()
    train_loss = 0
    print("Epoch:",epoch)

    for batch_idx,data in enumerate(train_loader):
        inputs,labels = data
        optimizer.zero_grad()

        output = model(inputs)
        loss = loss_criteria(output,labels)
        train_loss += loss.item()

        loss.backward()
        optimizer.step()

        print('\ttrain batch {} Loss: {:.6f} '.format(batch_idx + 1,loss.item()))
    average_loss = train_loss / (batch_idx + 1)
    print('train Average loss: {:.6f} '.format(average_loss))
    save_path = './CNN.pth'
    torch.save(model.state_dict(),save_path)
    return average_loss

def test(model,test_loader):
    model.eval()
    test_loss = 0
    correct = 0
    with torch.no_grad():
        batch_count = 0
        for data in test_loader:
            batch_count += 1
            data,target = data
            output = model(data)
            test_loss += loss_criteria(output,target).item()
            _,predicted = torch.max(output.data,1)
            correct += torch.sum(target == predicted).item()
    avg_loss = test_loss / batch_count
    test_acc = 100. * correct / len(test_loader.dataset)
    print('test Average loss: {:.6f}, Accuracy: {}/{} ({:.0f}%)\n'.format(
        avg_loss,correct,len(test_loader.dataset),test_acc))

    return avg_loss

1．6 运行结果及分析

打印迭代10个eproch的训练和测试的平均损失以及在测试集上的准确率
Epoch: 1
train Average loss: 0.599938
test Average loss: 0.466966, Accuracy: 1466/1725 (85%)

Epoch: 2
train Average loss: 0.349040
test Average loss: 0.388526, Accuracy: 1468/1725 (85%)

Epoch: 3
train Average loss: 0.317507
test Average loss: 0.329491, Accuracy: 1507/1725 (87%)

Epoch: 4
train Average loss: 0.276383
test Average loss: 0.227195, Accuracy: 1549/1725 (90%)

Epoch: 5
train Average loss: 0.232911
test Average loss: 0.191380, Accuracy: 1585/1725 (92%)

Epoch: 6
train Average loss: 0.199521
test Average loss: 0.266515, Accuracy: 1539/1725 (89%)

Epoch: 7
train Average loss: 0.204359
test Average loss: 0.234018, Accuracy: 1562/1725 (91%)

Epoch: 8
train Average loss: 0.183928
test Average loss: 0.219552, Accuracy: 1571/1725 (91%)

Epoch: 9
train Average loss: 0.172145
test Average loss: 0.196981, Accuracy: 1595/1725 (92%)

Epoch: 10
train Average loss: 0.154918
test Average loss: 0.208049, Accuracy: 1579/1725 (92%)

训练平均损失和测试平均损失可视化如下图：

混淆矩阵评判分类结果如下：

X轴对应真实标签；Y轴对应预测标签
对角线对应的预测准确的个数，以猫狗这两个类别来看，测试集上总共有264张猫的图片，有237张预测正确，有27张预测成了狗；由于随机分割，在测试集上狗的图片有192张。以猫狗为对比，预测正确只有95张，准确率比较低。在其他六个类别效果很好，在预测猫狗类上稍微差点，主要原因在猫狗图片相似处较多，得用深层得网络来提出特征。

Original: https://blog.csdn.net/hello15617900040/article/details/124894929
Author: 记住0和1
Title: 深度学习-基于(Pytorch)卷积神经网络对多分类实验分析

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/689210/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

机器学习（4）——弱监督学习

什么是弱监督学习？监督学习技术通过学习大量标记的训练样本来构建预测模型，在很多领域获得了巨大成功。但由于数据标注的本身往往需要很高成本，在很多任务上都很难获得全部真值标签这样比较…

人工智能 2023年6月15日
0089
特斯拉大裁员，苹果赢麻了？维基百科：我的每一条引用都AI过；面向工业落地的目标检测框架；我的『粗野主义』操作系统；MLOps概览 | ShowMeAI资讯日报

ShowMeAI 日报系列全新升级！覆盖AI人工智能工具&框架 | 项目&代码 | 博文&分享 | 数据&资源 | 研究&论文等方向。点…

人工智能 2023年7月11日
0057
SimCSE: Simple Contrastive Learning of Sentence Embeddings

SimCSE 论文目的 SimCSE: simple contrastive sentence embedding framework首先提出一种无监督的方法，仅使用dropout…

人工智能 2023年5月30日
0066
solidity 存储 /变量

EVM里有5个地方涉及存储 Storage/存储存储中的数据是永久存在的。存储是一个key/value库- 存储中的数据写入区块链，因此会修改状态，这也是存储使用成本高的原因。 …

人工智能 2023年6月28日
0059
5的分类为负类

问题介绍在机器学习中，分类任务是一个常见的问题。假设我们有一个数据集，其中包含一些数字。我们想要将这些数字进行分类，在这个例子中，我们想要将数字分类为正类和负类。我们的目标是构建…

人工智能 2023年12月31日
0030
【图像去噪】基于核回归算法实现图像去噪matlab代码

1 简介在对图像信息进行处理的过程中,由于种种原因,其质量有可能受到损害,噪声是其中之一。因此为了后续更高层次的处理,有必要对图像进行去噪。近年来,在非参数估计理论基础上发展起来…

人工智能 2023年6月18日
0086
深度学习框架是否支持模型的融合和集成，如模型的蒸馏和投票方法等

问题背景在深度学习领域中，有时候需要将多个模型进行融合和集成，以提高模型的预测性能。模型的融合可以通过多种方法实现，其中包括模型的蒸馏和投票方法。本文将详细介绍深度学习框架中如何…

人工智能 2024年1月1日
0023
torch学习笔记之——tensor维度变换

1, （函数API）View ， reshape 本上没有区别，0.3版本之前默认view之后默认使用reshape，现在版本建议使用view。 a = torch.rand(4,…

人工智能 2023年7月21日
0059
机器学习鸢尾花分类的原理和实现（一）

机器学习鸢尾花分类的原理和实现（一）前言：鸢尾花数据集是机器学习中的经典小规模数据集。通过查阅资料和视频进行学习，将整个实验的学习心得和实验过程分享，希望对喜爱机器学习并入门…

人工智能 2023年6月16日
0090
【YOLO3D】:端到端3D点云输入的实时检测

YOLO3D:端到端3D点云输入的实时检测前言算法分析 * 模型输入网络结构回归损失 – 3D box 回归偏航角回归边界框损失函数数据集处理 &#821…

人工智能 2023年5月28日
0063
机器学习10—多元线性回归模型

多元线性回归模型statsmodelsols 前言 * 什么是多元线性回归分析预测法一、多元线性回归二、多元线性回归模型求解 * 2.1最小二乘法实现参数估计—估计自变量X的系…

人工智能 2023年7月26日
0076
常用的高光谱遥感影像数据集（详细介绍+下载链接）

常用的高光谱遥感影像数据集前言数据集 * Indian Pines Salinas Pavia Centre and University – Pavia Cent…

人工智能 2023年7月16日
0075
通过深度学习实现对网络异常流量检测

消失了好几个月，突然想起来自己还有这么一个CSDN的账号，趁着这几天有空，总结一下最近这段时间所做的事情。前言：随着网络技术的快速发展，各式各样的新型恶意攻击不断出现。如何改善对…

人工智能 2023年7月21日
0058
Colab使用教程

最近在学习NLP，但是学习 深度学习算法，需要有 GPU，也就是显卡。而显卡，需要是 NV…

人工智能 2023年5月27日
0098
web前端期末大作业——基于HTML+CSS+JavaScript实现中国茶文化(30页)

🎉精彩专栏推荐 💭文末获取联系✍️ 作者简介: 一个热爱把逻辑思维转变为代码的技术博主💂 作者主页: 【主页——🚀获取更多优质源码】🎓 web前端期末大作业：【📚毕设项目精品实战…

人工智能 2023年6月26日
0098
神经网络学习笔记1——BP神经网络原理到编程实现（matlab，python）

目录先表达一下歉意吧下面是视频地址和代码数据 BP神经网络原理及编程实现_哔哩哔哩_bilibili 1.bp神经网络原理 1.1前向传播 1.2反向传播 1.3 测试模型 2…

人工智能 2023年7月14日
0049

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31