基于Pytorch的cifar-10图像分类问题代码实现

2023年6月20日上午10:13 • 人工智能 • 阅读 84

之前在学习深度学习图片分类任务的时候，跟着老师的讲解实现了一个Cifair-10的图像分类任务。

数据集地址：网盘地址需要解码。
数据有50000张训练图片和10000张测试图片。
下载好数据后，在文件夹下新建两个文件夹一个为Train，一个为Test，用来保存解码后的图片。如图：

解码后的训练集：

文件的解码方式官方已经给出：

def unpickle(file):
    with open(file, 'rb') as fo:
        dict = pickle.load(fo, encoding="bytes")
    return dict

解码训练集的py文件的具体代码如下：

import os
import pickle
import glob
import cv2
import numpy as np

def unpickle(file):
    with open(file, 'rb') as fo:
        dict = pickle.load(fo, encoding="bytes")
    return dict
lable_name = ["airplane",
              "automobile",
              "bird",
              "cat",
              "deer",
              "dog",
              "frog",
              "horse",
              "ship",
              "truck"]

train_list = glob.glob("D:\*\cifar-10-python\cifar-10-batches-py\data_batch_*")
print(train_list)
save_path = "D:\*\cifar-10-python\cifar-10-batches-py\Train"

for l in train_list:
    print(l)
    l_dict = unpickle(l)

    print(l_dict)
    print(l_dict.keys())

    for im_idx, im_data in enumerate(l_dict[b'data']):
        print(im_idx)
        print(im_data)

解码测试集的py文件的具体代码如下：

import os
import pickle

import cv2
import numpy as np

def unpickle(file):
    with open(file, 'rb') as fo:
        dict = pickle.load(fo, encoding="bytes")
    return dict
lable_name = ["airplane",
              "automobile",
              "bird",
              "cat",
              "deer",
              "dog",
              "frog",
              "horse",
              "ship",
              "truck"]

import glob

train_list = glob.glob("D:\genglijia\cifar-10-python\cifar-10-batches-py\Test_batch")
print(train_list)
save_path = "D:\genglijia\cifar-10-python\cifar-10-batches-py\Test"

for l in train_list:
    print(l)
    l_dict = unpickle(l)

    print(l_dict)
    print(l_dict.keys())

    for im_idx, im_data in enumerate(l_dict[b'data']):
        print(im_idx)
        print(im_data)

        im_lable = l_dict[b'labels'][im_idx]
        im_name = l_dict[b'filenames'][im_idx]

        print(im_lable, im_name, im_data)

        im_lable_name = lable_name[im_lable]
        im_data = np.reshape(im_data, [3, 32, 32])
        im_data = np.transpose(im_data, (1, 2, 0))

        if not os.path.exists("{}/{}".format(save_path,
                                             im_lable_name)):
                    os.mkdir("{}/{}".format(save_path,
                                             im_lable_name))
        cv2.imwrite("{}/{}/{}".format(save_path,
                                   im_lable_name,
                                   im_name.decode("utf-8")),
                                   im_data)

加载本地数据集的py文件：

import glob
from torchvision import transforms
from torch.utils.data import DataLoader,Dataset
import os
from PIL import Image
import numpy as np

lable_name = ["airplane","automobile","bird",
              "cat","deer","dog","frog",
              "horse","ship","truck"]

lable_dict = {}

for idx, name in enumerate(lable_name):
    lable_dict[name] = idx
print(lable_dict)
def default_loader(path):
    return Image.open(path).convert("RGB")

train_transform = transforms.Compose([
    transforms.RandomHorizontalFlip(),
    transforms.RandomVerticalFlip(),
    transforms.ToTensor(),
    transforms.Normalize((0.4914, 0.4822, 0.4465),
                         (0.2023, 0.1994, 0.2010)),
])

test_transform = transforms.Compose([
    transforms.CenterCrop((32, 32)),
    transforms.ToTensor(),
    transforms.Normalize((0.4914, 0.4822, 0.4465),
                         (0.2023, 0.1994, 0.2010)),
])

class MyDataset(Dataset):

    def __init__(self, im_list, transform=None, loader=default_loader):
        super(MyDataset, self).__init__()
        imgs = []
        for im_item in im_list:
            im_lable_name = im_item.split("\\")[-2]
            imgs.append([im_item, lable_dict[im_lable_name]])

        self.imgs = imgs
        self.transform = transform
        self.loader = loader

    def __getitem__(self, index):
        im_path,im_lable = self.imgs[index]
        im_data = self.loader(im_path)
        if self.transform is not None:
            im_data = self.transform(im_data)
        return im_data, im_lable

    def __len__(self):
        return len(self.imgs)

im_train_list = glob.glob("D:\*\cifar-10-python\cifar-10-batches-py\Train\*\*.png")
im_test_list = glob.glob("D:\*\cifar-10-python\cifar-10-batches-py\Test\*\*.png")

train_dataset = MyDataset(im_train_list, transform=train_transform)
test_dataset = MyDataset(im_test_list, transform=transforms.ToTensor())

train_loader = DataLoader(dataset=train_dataset,
                            batch_size=64,
                            shuffle=True,
                            num_workers=0)

test_loader = DataLoader(dataset=test_dataset,
                            batch_size=64,
                            shuffle=False,
                            num_workers=0)
print("num_of_train", len(train_dataset))
print("num_of_test", len(test_dataset))

定义网络结构的py文件（用的是经典resnet残差网络机构，也可以用其他的网络结构例如：vggnet、mobilenet等）：

import torch
import torch.nn as nn
import torch.nn.functional as F

class ResBlock(nn.Module):
    def __init__(self, in_channel, out_channel, stride=1):
        super(ResBlock, self).__init__()
        self.layer = nn.Sequential(
            nn.Conv2d(in_channel, out_channel,
                      kernel_size=3, stride=stride, padding=1),
            nn.BatchNorm2d(out_channel),
            nn.ReLU(),
            nn.Conv2d(out_channel, out_channel,
                      kernel_size=3, stride=1, padding=1),
            nn.BatchNorm2d(out_channel),
        )
        self.shortcut = nn.Sequential()
        if in_channel != out_channel or stride > 1:

            self.shortcut = nn.Sequential(
                nn.Conv2d(in_channel, out_channel,
                          kernel_size=3, stride=stride, padding=1),
                nn.BatchNorm2d(out_channel),
            )

    def forward(self, x):
        out1 = self.layer(x)
        out2 = self.shortcut(x)
        out = out1 + out2
        out = F.relu(out)
        return out

class ResNet(nn.Module):

    def make_layer(self, block, out_channel, stride, num_block):
        layers_list = []
        for i in range(num_block):
            if i == 0:
                in_stride = stride
            else:
                in_stride = 1
            layers_list.append(block(self.in_channel,out_channel, in_stride))
            self.in_channel = out_channel
        return nn.Sequential(*layers_list)

    def __init__(self, ResBlock):
        super(ResNet, self).__init__()
        self.in_channel = 32
        self.conv1 = nn.Sequential(
            nn.Conv2d(3, 32, kernel_size=3, stride=1, padding=1),
            nn.BatchNorm2d(32),
            nn.ReLU()
        )
        self.layer1 = \
            self.make_layer(ResBlock, 64, 2, 2)

        self.layer2 = \
            self.make_layer(ResBlock, 128, 2, 2)

        self.layer3 = \
            self.make_layer(ResBlock, 256, 2, 2)

        self.layer4 = \
            self.make_layer(ResBlock, 512, 2, 2)

        self.fc = nn.Linear(512, 10)

    def forward(self,x):
        out = self.conv1(x)
        out = self.layer1(out)
        out = self.layer2(out)
        out = self.layer3(out)
        out = self.layer4(out)
        out = F.avg_pool2d(out, 2)
        out = out.view(out.size(0), -1)
        out = self.fc(out)
        return out

def resnet():
    return ResNet(ResBlock)

训练和测试的py文件：

import torch
import torch.nn as nn
import torchvision
from resnet import resnet
from load_cifar10 import train_loader,test_loader
import os

epoch_num = 1
lr = 0.01
batch_size = 128
net = resnet()

loss_func = nn.CrossEntropyLoss()

optimizer = torch.optim.Adam(net.parameters(), lr=lr)

scheduler = torch.optim.lr_scheduler.StepLR(optimizer, step_size=1, gamma=0.9)

if __name__ == '__main__':
    for epoch in range(epoch_num):
        net.train()

        for i, data in enumerate(train_loader):
            inputs, labels = data

            outputs = net(inputs)
            loss = loss_func(outputs, labels)
            optimizer.zero_grad()
            loss.backward()
            optimizer.step()
            batch_size = inputs.size(0)
            _, pred = torch.max(outputs.data, dim=1)
            correct = pred.eq(labels.data).sum()
            print("train step", i, "loss is:", loss.item(), "mini-batch correct is:", 1.0 * correct / batch_size)

        if not os.path.exists("models"):
            os.mkdir("models")
        torch.save(net.state_dict(),"models/{}.pth".format(epoch+1))
        scheduler.step()

        sum_loss = 0
        sum_correct = 0

        for i, data in enumerate(test_loader):
            net.eval()
            inputs, labels = data

            outputs = net(inputs)
            loss = loss_func(outputs, labels)
            _, pred = torch.max(outputs.data, dim=1)
            correct = pred.eq(labels.data).sum()

            sum_loss += loss.item()
            sum_correct += correct.item()

            im = torchvision.utils.make_grid(inputs)

        test_loss = sum_loss*1.0/len(test_loader)
        test_correct = sum_correct *1.0/len(test_loader)/batch_size

        print("epoch", epoch+1, "loss is:", test_loss, "mini-batch correct is:", test_correct)

测试的结果：

这里面epoch为1，因为没有GPU训练的太慢就只训练了一次，正确率也有了百分之70左右，有条件的话多训练几次应该会达到更高。也可以改网络结构啥的，方法很多。

完成后可以在Test的文件夹中看到已经分类好的图片。

有什么疑问可以在下面评论哦~大家一起加油学习！！！

Original: https://blog.csdn.net/weixin_44250159/article/details/124518562
Author: 啊砉
Title: 基于Pytorch的cifar-10图像分类问题代码实现

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/641074/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Labelme 批量转 dataset 使用 labelme_json_to_dataset 命令（简明图文教程）

Labelme 批量转 dataset 0.概述 1.原理 2.代码 3.试验过程 * 3.1 实验一：输入单个目录 3.2 实验二：增加参数 –out 输出文件目录…

人工智能 2023年6月25日
0097
pandas dataframe多层索引取值

import pandas as pd import numpy as np 新建df数据 df = pd.DataFrame(np.random.randint(50, 100,…

人工智能 2023年6月2日
00155
【Selenium】Selenium获取Network数据（高级版）

前言为解决从Selenium中获取Network接口数据，潜心研究了一小会儿，遂有此文基本看这篇文章的，多多少少都跟 spider 沾亲带故。所以直接进入正题。只想要代码，文…

人工智能 2023年7月5日
0085
Redis使用的21条军规（规范）

Redis使用的21条军规（规范）文章目录 Redis使用的21条军规（规范）前言一、基础规范【5条】二、键值设计【4条】三、操作命令【4条】四、内存优化【4条】五、…

人工智能 2023年6月29日
0078
VAE的Pytorch实现和可视化

我的代码在kaggle上跑的 VAE import torch import torchvision from torch import nn from torch import …

人工智能 2023年7月24日
0060
图像二值化处理(全局阈值自适应阈值手动阈值操作以及直方图画法)

文章目录图像二值化处理 * 二值化原理 API介绍手动设置阈值 – 均值法迭代法自动设置阈值 – 直方图法全局阈值法 + OTSU法三角形法自…

人工智能 2023年6月17日
0099
YOLO5入门

下载路径目录结构 . |– CONTRIBUTING.md |– Dockerfile |– LICENSE |– README.md |– data | |– Ar…

人工智能 2023年7月12日
0050
support vector regression（SVR）支持向量回归

支持向量机、 回归、 &a…

人工智能 2023年6月17日
0084
经典的数据湖“不可能三角”，如何有效解决？

数据湖是什么？提到数据湖就要先说一下数据仓库，数据仓库是集成多业务系统数据、面向主题的、专门用于数据查询分析的数据组织形式。当业务系统数据量不断增大、业务系统数量不断增多以后，数…

人工智能 2023年7月16日
0068
模式识别作业–人脸识别（python+PCA+pytorch神经网络）

模式识别作业–人脸识别（python+PCA+pytorch） 1、实验原理该实验通过PCA降维+BP神经网络的算法实现对人脸数据集中人脸数据的识别 2、实验步骤 1、图片预处理…

人工智能 2023年7月12日
0063
《视觉SLAM十四讲第二版》课后习题

本文为《视觉SLAM十&a…

人工智能 2023年6月2日
0075
【Python基础篇012】匿名函数和全部内置函数详细认识（下篇）

🍁一、reversed内置函数 🍁二、slice内置函数 🍁三、format内置函数 🍁四、bytes内置函数 🍁五、bytearray内置函数 🍁六、memoryview内置函数…

人工智能 2023年7月5日
0063
动物分类name，bloodType，giveBirth，canFly，liveInWater

机器学习中分类规则模型的表达和应用，将分类模型（规则分类器或决策树分类器）用程序语言表达。实验用例：下面的表数据是动物实际类别数据，即训练样本。图片复制掉了根据此数据，通过机器…

人工智能 2023年7月3日
0084
如何在Java中使用opencv，windows&linux

1.将opencv-4.0.1目录拷贝到服务器根目录 / (可放到任何目录，后续配置做相应更改即可，这里以根目录为例)2. 打开系统配置目录 cd /etc/ld.so.conf….

人工智能 2023年7月19日
0058
FPGA图像处理——YCbCr灰度转换

之前的单通道灰度转换作为一个图像处理FPGA框架搭建完成后的一个简单效果的测试，其图像的层次感有待提高，图像处理灰度转换用的更多的还是YCbCr。一、YCbCrYCbCr或Y&#8…

人工智能 2023年6月20日
0093
Keras深度学习实战（2）——使用Keras构建神经网络

Keras深度学习实战（2）——使用Keras构建神经网络 * – 0 前言 – 1. Keras 简介与安装 – 2. Keras 构建神经网…

人工智能 2023年5月26日
0084

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

基于Pytorch的cifar-10图像分类问题代码实现

大家都在看