【深度学习】Pytorch实现CIFAR10图像分类任务测试集准确率达95%

2023年7月25日下午8:51 • 人工智能 • 阅读 78

文章目录

*
– 前言
– CIFAR10简介
– Backbone选择
– 训练+测试
–
+ 训练环境及超参设置
+ 完整代码
– 部分测试结果
– 完整工程文件
– Reference

前言

分享一下本人去年入门深度学习时，在CIFAR10数据集上做的图像分类任务，使用了多个主流的backbone网络，希望可以为同样想入门深度学习的同志们，提供一个方便上手、容易理解的参考教程。

CIFAR10简介

CIFAR-10数据集是图像分类领域经典的数据集，由 Hinton 的学生 Alex Krizhevsky 和 Ilya Sutskever 整理得到，一共包含10个类别的 RGB彩色图片：飞机（ airplane ）、汽车（ automobile ）、鸟类（ bird ）、猫（ cat ）、鹿（ deer ）、狗（ dog ）、蛙类（ frog ）、马（ horse ）、船（ ship ）和卡车（ truck ），图片的尺寸为 32×32 ，数据集中一共有 50000 张训练圄片和 10000 张测试图片。 CIFAR-10 的图片样例如图所示

Pytorch中提供了如下命令可以直接将CIFAR10数据集下载到本地：

import torchvision
dataset = torchvision.datasets.CIFAR10(root, train=True, download=True, transform)

root：数据集加载到本地的路径
train=True：True表示加载训练集，False加载测试集
download=True：True表示加载数据集到root，若数据集已经存在，则不会再加载
transform：数据增强

这里分享一个加载CIFAR10数据集的完整代码：


print('==> Preparing data..')
transform_train = transforms.Compose([
    transforms.RandomCrop(32, padding=4),
    transforms.RandomHorizontalFlip(),
    transforms.ToTensor(),
    transforms.Normalize((0.4914, 0.4822, 0.4465), (0.2023, 0.1994, 0.2010)),
])

transform_test = transforms.Compose([
    transforms.ToTensor(),
    transforms.Normalize((0.4914, 0.4822, 0.4465), (0.2023, 0.1994, 0.2010)),
])

trainset = torchvision.datasets.CIFAR10(
    root=opt.data, train=True, download=True, transform=transform_train)
trainloader = torch.utils.data.DataLoader(
    trainset, batch_size=opt.batch_size, shuffle=True, num_workers=2)

testset = torchvision.datasets.CIFAR10(
    root=opt.data, train=False, download=True, transform=transform_test)
testloader = torch.utils.data.DataLoader(
    testset, batch_size=100, shuffle=False, num_workers=2)

Backbone选择

本文主要尝试了以下几个主流的backbone网络，并在CIFAR10上实现了图像分类任务：

LetNet
AlexNet
VGG
GoogLeNet(InceptionNet)
ResNet
DenseNet
ResNeXt
SENet
MobileNetv2-v3
ShuffleNetv2
EfficientNetB0
Darknet53
CSPDarknet53

这里放上测试结果最好的ResNet模块的构建代码，其他代码放到最后完整工程backbone文件夹中：

"""
pytorch实现ResNet50、ResNet101和ResNet152:
"""
import torch
import torch.nn as nn
import torchvision
import torch.nn.functional as F

def Conv1(channel_in, channel_out, stride=2):
    return nn.Sequential(
        nn.Conv2d(
            channel_in,
            channel_out,
            kernel_size=7,
            stride=stride,
            padding=3,
            bias=False
        ),
        nn.BatchNorm2d(channel_out),

        nn.ReLU(inplace=True),
        nn.MaxPool2d(kernel_size=3, stride=stride, padding=1)
    )

class BasicBlock(nn.Module):
    expansion = 1

    def __init__(self, in_planes, planes, stride=1):
        super(BasicBlock, self).__init__()
        self.conv1 = nn.Conv2d(
            in_planes, planes, kernel_size=3, stride=stride, padding=1, bias=False)
        self.bn1 = nn.BatchNorm2d(planes)
        self.conv2 = nn.Conv2d(planes, planes, kernel_size=3,
                               stride=1, padding=1, bias=False)
        self.bn2 = nn.BatchNorm2d(planes)

        self.shortcut = nn.Sequential()
        if stride != 1 or in_planes != self.expansion * planes:
            self.shortcut = nn.Sequential(
                nn.Conv2d(in_planes, self.expansion * planes,
                          kernel_size=1, stride=stride, bias=False),
                nn.BatchNorm2d(self.expansion * planes)
            )

    def forward(self, x):
        out = F.relu(self.bn1(self.conv1(x)))
        out = self.bn2(self.conv2(out))
        out += self.shortcut(x)
        out = F.relu(out)
        return out

class Bottleneck(nn.Module):
    expansion = 4

    def __init__(self, in_planes, planes, stride=1):
        super(Bottleneck, self).__init__()

        self.conv1 = nn.Conv2d(in_planes, planes, kernel_size=1, bias=False)
        self.bn1 = nn.BatchNorm2d(planes)
        self.conv2 = nn.Conv2d(planes, planes, kernel_size=3,
                               stride=stride, padding=1, bias=False)
        self.bn2 = nn.BatchNorm2d(planes)
        self.conv3 = nn.Conv2d(planes, self.expansion *
                               planes, kernel_size=1, bias=False)
        self.bn3 = nn.BatchNorm2d(self.expansion * planes)

        self.shortcut = nn.Sequential()
        if stride != 1 or in_planes != self.expansion * planes:
            self.shortcut = nn.Sequential(
                nn.Conv2d(in_planes, self.expansion * planes,
                          kernel_size=1, stride=stride, bias=False),
                nn.BatchNorm2d(self.expansion * planes)
            )

    def forward(self, x):
        out = F.relu(self.bn1(self.conv1(x)))
        out = F.relu(self.bn2(self.conv2(out)))
        out = self.bn3(self.conv3(out))
        out += self.shortcut(x)
        out = F.relu(out)
        return out

class ResNet(nn.Module):
    def __init__(self, block, num_blocks, num_classes=10):
        super(ResNet, self).__init__()
        self.in_planes = 64
        self.conv1 = nn.Conv2d(3, 64, kernel_size=3,
                               stride=1, padding=1, bias=False)
        self.bn1 = nn.BatchNorm2d(64)

        self.layer1 = self._make_layer(block, 64, num_blocks[0], stride=1)
        self.layer2 = self._make_layer(block, 128, num_blocks[1], stride=2)
        self.layer3 = self._make_layer(block, 256, num_blocks[2], stride=2)
        self.layer4 = self._make_layer(block, 512, num_blocks[3], stride=2)
        self.linear = nn.Linear(512 * block.expansion, num_classes)

    def _make_layer(self, block, planes, num_blocks, stride):
        strides = [stride] + [1] * (num_blocks - 1)

        layers = []
        for stride in strides:
            layers.append(block(self.in_planes, planes, stride))
            self.in_planes = planes * block.expansion
        return nn.Sequential(*layers)

    def forward(self, x):
        out = F.relu(self.bn1(self.conv1(x)))
        out = self.layer1(out)
        out = self.layer2(out)
        out = self.layer3(out)
        out = self.layer4(out)
        out = F.avg_pool2d(out, 4)
        out = out.view(out.size(0), -1)
        out = self.linear(out)
        return out

def ResNet18():
    return ResNet(BasicBlock, [2, 2, 2, 2])

def ResNet34():
    return ResNet(BasicBlock, [3, 4, 6, 3])

def ResNet50():
    return ResNet(Bottleneck, [3, 4, 6, 3])

def ResNet101():
    return ResNet(Bottleneck, [3, 4, 23, 3])

def ResNet152():
    return ResNet(Bottleneck, [3, 8, 36, 3])

训练+测试

训练环境及超参设置

本文的训练环境和超参数设置如下：

1块1080 Ti GPU
epoch为100
batch-size为128
优化器：SGD
学习率：余弦退火有序调整学习率

主要步骤如下：

加载数据集
将数据集加载到本地
按batch-size加载到dataLoader
设置相关参数
指定GPU
训练相关参数
断点续训
模型保存参数
设置优化器
设置学习率
循环每个epoch
开启训练
开启测试
学习率调整
数据可视化
*打印结果

完整代码

'''Train CIFAR10 with PyTorch.'''
import torchvision.transforms as transforms
import time
import torch
import torchvision
import torch.nn as nn
import torch.optim as optim
import torch.backends.cudnn as cudnn
from torch.utils.data import DataLoader
import matplotlib.pyplot as plt
import os
import argparse

from backbones.ResNet import ResNet18

os.environ['CUDA_VISIBLE_DEVICES'] = '1'

def time_sync():

    if torch.cuda.is_available():
        torch.cuda.synchronize()
    return time.time()

def train(epoch):
    model.train()
    train_loss = 0
    correct = 0
    total = 0
    train_acc = 0

    for batch_idx, (inputs, targets) in enumerate(trainloader):

        inputs, targets = inputs.to(device), targets.to(device)

        optimizer.zero_grad()
        outputs = model(inputs)
        loss = criterion(outputs, targets)
        loss.backward()
        optimizer.step()

        train_loss += loss.item()
        _, predicted = outputs.max(1)
        total += targets.size(0)
        correct += predicted.eq(targets).sum().item()

        train_acc = correct / total

        if (batch_idx + 1) % 100 == 0:
            print('[INFO] Epoch-{}-Batch-{}: Train: Loss-{:.4f}, Accuracy-{:.4f}'.format(epoch + 1,
                                                                                         batch_idx + 1,
                                                                                         loss.item(),
                                                                                         train_acc))

    total_train_acc.append(train_acc)

def test(epoch, ckpt):
    global best_acc
    model.eval()
    test_loss = 0
    correct = 0
    total = 0
    test_acc = 0
    with torch.no_grad():
        for batch_idx, (inputs, targets) in enumerate(testloader):
            inputs, targets = inputs.to(device), targets.to(device)
            outputs = model(inputs)
            loss = criterion(outputs, targets)

            test_loss += loss.item()
            _, predicted = outputs.max(1)
            total += targets.size(0)
            correct += predicted.eq(targets).sum().item()

        test_acc = correct / total
        print(
            '[INFO] Epoch-{}-Test Accurancy: {:.3f}'.format(epoch + 1, test_acc), '\n')

    total_test_acc.append(test_acc)

    acc = 100. * correct / total
    if acc > best_acc:
        print('Saving..')
        state = {
            'net': model.state_dict(),
            'acc': acc,
            'epoch': epoch,
        }
        if not os.path.isdir('checkpoint'):
            os.mkdir('checkpoint')
        torch.save(state, ckpt)
        best_acc = acc

if __name__ == '__main__':

    parser = argparse.ArgumentParser(description='PyTorch CIFAR10 Training')
    parser.add_argument('--epochs', type=int, default=100)
    parser.add_argument('--batch_size', type=int, default=128)
    parser.add_argument('--data', type=str, default='cifar10')
    parser.add_argument('--T_max', type=int, default=100)
    parser.add_argument('--lr', default=0.1, type=float, help='learning rate')
    parser.add_argument('--resume', '-r', action='store_true', help='resume from checkpoint')
    parser.add_argument('--checkpoint', type=str, default='checkpoint/ResNet18-CIFAR10.pth')
    opt = parser.parse_args()

    device = torch.device('cuda:0') if torch.cuda.is_available() else 'cpu'
    best_acc = 0
    start_epoch = 0
    classes = ('plane', 'car', 'bird', 'cat', 'deer',
               'dog', 'frog', 'horse', 'ship', 'truck')

    print('==> Preparing data..')
    transform_train = transforms.Compose([
        transforms.RandomCrop(32, padding=4),
        transforms.RandomHorizontalFlip(),
        transforms.ToTensor(),
        transforms.Normalize((0.4914, 0.4822, 0.4465), (0.2023, 0.1994, 0.2010)),
    ])

    transform_test = transforms.Compose([
        transforms.ToTensor(),
        transforms.Normalize((0.4914, 0.4822, 0.4465), (0.2023, 0.1994, 0.2010)),
    ])

    trainset = torchvision.datasets.CIFAR10(
        root=opt.data, train=True, download=True, transform=transform_train)
    trainloader = torch.utils.data.DataLoader(
        trainset, batch_size=opt.batch_size, shuffle=True, num_workers=2)

    testset = torchvision.datasets.CIFAR10(
        root=opt.data, train=False, download=True, transform=transform_test)
    testloader = torch.utils.data.DataLoader(
        testset, batch_size=100, shuffle=False, num_workers=2)

    print('==> Building model..')
    model = ResNet18().to(device)

    if device == 'cuda':
        model = torch.nn.DataParallel(model)
        cudnn.benchmark = True

    if opt.resume:

        print('==> Resuming from checkpoint..')
        assert os.path.isdir('checkpoint'), 'Error: no checkpoint directory found!'
        checkpoint = torch.load(opt.checkpoint)
        model.load_state_dict(checkpoint['net'])
        best_acc = checkpoint['acc']
        start_epoch = checkpoint['epoch']

    criterion = nn.CrossEntropyLoss()
    optimizer = optim.SGD(model.parameters(), lr=opt.lr,
                          momentum=0.9, weight_decay=5e-4)

    scheduler = torch.optim.lr_scheduler.CosineAnnealingLR(optimizer, T_max=opt.T_max)

    total_test_acc = []
    total_train_acc = []

    tic = time_sync()

    for epoch in range(opt.epochs):
        train(epoch)
        test(epoch, opt.checkpoint)

        scheduler.step()

    plt.figure()
    plt.plot(range(opt.epochs), total_train_acc, label='Train Accurancy')
    plt.plot(range(opt.epochs), total_test_acc, label='Test Accurancy')
    plt.xlabel('Epoch')
    plt.ylabel('Accurancy')
    plt.title('ResNet18-CIFAR10-Accurancy')
    plt.legend()
    plt.savefig('output/ResNet18-CIFAR10-Accurancy.jpg')
    plt.show()

    print(f'Best Acc: {best_acc * 100}%')
    toc = time_sync()

    t = (toc - tic) / 3600
    print(f'Training Done. ({t:.3f}s)')

部分测试结果

BackboneBest AccMobileNetv293.37%VGG1693.80%DenseNet12194.55%GoogLeNet95.02%ResNeXt29_32×4d95.18%ResNet5095.20%SENet1895.22%
ResNet18 95.23%

完整工程文件

Pytorch实现CIFAR10图像分类任务测试集准确率达95%

Reference

CIFAR-10 数据集

深度学习入门基础教程(二) CNN做CIFAR10数据集图像分类 pytorch版代码

Pytorch CIFAR10 图像分类篇汇总

pytorch-cifar：使用PyTorch在CIFAR10上为95.47％

Original: https://blog.csdn.net/weixin_43799388/article/details/123869028
Author: 嗜睡的篠龙
Title: 【深度学习】Pytorch实现CIFAR10图像分类任务测试集准确率达95%

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/715759/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

使用OpenCV调整图像大小

要调整图像的大小，可以沿着每个轴 (高度和宽度)缩放它，考虑指定的比例…

人工智能 2023年5月26日
0081
VMware三种网络模式详解

VMware三种网络模式 linux重启网络服务命令： *service network restart 一、桥接模式原理：VMware和宿主机，处于同一网段、两者地位平等。（无…

人工智能 2023年6月29日
0067
阿里天池：小样本商标检测（baseline0.50）

阿里天池：小样本商标检测（baseline0.50）在学会YOLO目标检测后第一次参加这样的比赛，特此做个记录，此处也提出一些改进的方案。比赛链接：ICME-2022 安全AI挑…

人工智能 2023年7月10日
0077
轨迹预测分享

一、宋浩然博士Prime分享分享链接：自动驾驶中的车辆轨迹预测 1、预测在自动驾驶中的作用预测模块在自动驾驶中起到一个承上启下的作用，上游感知模块一般采用数据驱动的方法来进行单…

人工智能 2023年6月25日
0076
文本处理环境配置

第一步:安装相应软件根据自己电脑的配置去官网依次安装python、pycharm和anaconda,我自己的是macbook pro,自身没有GPU,但是我也用win,自己对比下…

人工智能 2023年5月24日
0086
SCTransform：单细胞样本的标准化

每次我在国内直接用这种方法下载数据集都没有成功，如上，下载安装包，本地安装： install.packages(“H:/singlecell/Seurat/stxBra…

人工智能 2023年6月17日
0056
zootracer使用说明——一款视频物体追踪软件，获取运动物体在屏幕坐标系的运动轨迹

警告！软件会使用大量计算机资源，请使用配置较高的电脑运行程序！不然容易把电脑跑坏！我的配置：CPU: AMD Ryzen 7 5800H with Radeon Graphics…

人工智能 2023年6月20日
00140
自动驾驶——软件和云服务介绍

本文是对自动驾驶领域需要的软件进行了系统的总结，属于入门级介绍科普文。无人驾驶软件分为车辆端和云端2个部分，其中车辆端运行操作系统和无人驾驶系统，云端提供无人驾驶所需要的各种服务…

人工智能 2023年6月2日
0075
深度学习之图像分类（十一）–MobileNetV2 网络结构

深度学习之图像分类（十一）MobileNetV2 网络结构目录 * – 深度学习之图像分类（十一）MobileNetV2 网络结构 – + 1. 前言 +…

人工智能 2023年7月21日
0049
【机器学习入门】(13) 实战：心脏病预测，补充: ROC曲线、精确率–召回率曲线，附python完整代码和数据集

各位同学好，经过前几章python机器学习的探索，想必大家对各种预测方法也有了一定的认识。今天我们来进行一次实战，心脏病病例预测，本文对一些基础方法就不进行详细解释，有疑问的同学可…

人工智能 2023年6月30日
00107
机器学习分类常见评价标准

目录 1.准确率（Accuracy） 2.精确率（Precision） 3.召回率（Recall） 4.PR曲线与F1值（F1 Score） 5.ROC曲线与AUC 评价分类器性能…

人工智能 2023年7月2日
0064
用随机森林分类器和GBDT进行特征筛选

一、决策树（类型、节点特征选择的算法原理、优缺点、随机森林算法产生的背景） 1、分类树和回归树由目标变量是离散的还是连续的来决定的；目标变量是离散的，选择分类树；反之（目标变量是…

人工智能 2023年5月28日
0078
线性回归python实现详解（附公式推导）

1线性回归在简单线性回归中，输入x只有一个特征，通过调整a和b的参数值，来拟合从x到y的线性关系。下图为进行拟合所需要优化的目标，也即是MES（Mean Squared Erro…

人工智能 2023年7月4日
0062
简单实现几篇知识图谱嵌入(Knowledge Graph Embedding，KGE)模型

关于知识图谱嵌入的理论介绍：简要总结一篇关于知识图谱嵌入的综述 KGE的诸多方法 KGE就是将实体和关系嵌入到低维向量空间中，同时保留KG的结构和语义信息现有的KGE方法可以划…

人工智能 2023年6月1日
0066
Python每日一练—–打家劫舍

⛅ （day13） 🖍题目：题目分析：解题思路： 🌈动态规划解法 🌈代码注释 🌈优化假设你是一个专业的小偷，计划偷窃沿街的房屋。每间房内都藏有一定的现金，影响你偷窃的唯一制约…

人工智能 2023年6月17日
0067
SPADE(GauGAN)代码运行方法

SPADE运行方法写在前面 * 为什么Pix2PixHD和SPADE都不用RGB作为输入如何运行SPADE 可能遇到的问题 (2022/04/28更)如何控制合成风格 (202…

人工智能 2023年7月23日
0060

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31