Pytorch深度学习记录：对CIFAR-10的深度学习模型搭建与测试

2023年7月28日上午6:55 • 人工智能 • 阅读 61

前言

CIFAR-10介绍
下载、分类与读入数据集
*
数据集下载
解压与分类数据集
读入数据
搭建神经网络
*
卷积层（Convolutional layer）
池化层（Pooling lay）
残差网络（Residual Network）
全连接层（Fully connected layer）
激活函数（Activation function）
代码实现
模型结构
训练与测试模型
*
损失计算
优化器
循环训练
测试
20轮训练结果
保存、加载模型
*
保存模型
加载模型
实际测试效果
参考

正在学习深度学习中，主要用于复习与巩固。欢迎大家批评指正，一起讨论学习，进步。

CIFAR-10介绍

The CIFAR-10 and CIFAR-100 are labeled subsets of the 80 million tiny images dataset. They were collected by Alex Krizhevsky, Vinod Nair, and Geoffrey Hinton.

CIFAR-10 和 CIFAR-100 是 8000 万个微小图像数据集的标记子集。它们由 Alex Krizhevsky、Vinod Nair 和 Geoffrey Hinton 收集。
The dataset is divided into five training batches and one test batch, each with 10000 images. The test batch contains exactly 1000 randomly-selected images from each class. The training batches contain the remaining images in random order, but some training batches may contain more images from one class than another. Between them, the training batches contain exactly 5000 images from each class.

数据集分为五个训练批次和一个测试批次，每个批次有 10000 张图像。测试批次恰好包含来自每个类别的 1000 个随机选择的图像。训练批次包含随机顺序的剩余图像，但一些训练批次可能包含来自一个类的图像多于另一个。在它们之间，训练批次恰好包含来自每个类别的 5000 张图像。
Here are the classes in the dataset, as well as 10 random images from each：
以下是数据集中的类，以及每个类的 10 张随机图像

The classes are completely mutually exclusive. There is no overlap between automobiles and trucks. “Automobile” includes sedans, SUVs, things of that sort. “Truck” includes only big trucks. Neither includes pickup trucks.

这些类是完全互斥的。汽车和卡车之间没有重叠。”汽车”包括轿车、SUV 之类的东西。”卡车”只包括大卡车。两者都不包括皮卡车。

; 下载、分类与读入数据集

数据集下载

网页下载：(http://www.cs.toronto.edu/~kriz/cifar.html)
百度网盘连接：链接：https://pan.baidu.com/s/1rwgBPp9fQ33goR77_0sj6Q
提取码：8wpb

包含的文件：

; 解压与分类数据集

为方便数据处理，将图片按照10个类别存放在各自的文件夹中。
处理后效果图：
分为测试集文件夹和训练集文件夹

测试集和训练集中都包含了10个类别的文件夹

训练集中每个类别有5000张图片，测试集有1000张

代码如下：

import os
from imageio import imsave

def unpickle(file):
    import pickle
    with open(file, 'rb') as fo:
        dict = pickle.load(fo, encoding='bytes')
    return dict

filename = 'cifar-10-batches-py文件夹的路径'
meta = unpickle(filename + '/batches.meta')
label_name = meta[b'label_names']
print(label_name)

for i in range(len(label_name)):
    file = label_name[i].decode()
    path = '想要建立文件夹train的路径' + file
    isExist = os.path.exists(path)
    if not isExist:
        os.makedirs(path)

for i in range(1, 6):
    content = unpickle(filename + '/data_batch_' + str(i))
    for j in range(10000):
        img = content[b'data'][j]
        img = img.reshape(3, 32, 32)
        img = img.transpose(1, 2, 0)
        img_name = '建立文件夹train的路径' + label_name[content[b'labels'][j]].decode() + '/batch_' + str(i) + '_num_' + str(j) + '.jpeg'
        imsave(img_name, img)

path = '建立文件夹train的路径'
filelist = os.listdir(path)
for item in filelist:
    pathnew=os.path.join(path,item)
    imagelist = os.listdir(pathnew)
    j = 1
    for i in imagelist:
        src = os.path.join(os.path.abspath(pathnew), i)
        dst = os.path.join(os.path.abspath(pathnew), '' + item + '.' + str(j) + '.jpeg')
        j = j+1
        os.rename(src, dst)

meta1 = unpickle(filename + '/test_batch')
label_name1 = meta[b'label_names']

for i in range(len(label_name1)):
    file = label_name1[i].decode()
    path = '想要建立文件夹test的路径' + file
    isExist = os.path.exists(path)
    if not isExist:
        os.makedirs(path)

for j in range(10000):
    img = meta1[b'data'][j]
    img = img.reshape(3, 32, 32)
    img = img.transpose(1, 2, 0)
    img_name = '建立文件夹test的路径' + label_name[
        meta1[b'labels'][j]].decode() + '/batch_' + str(j) + '_num_' + str(j) + '.jpeg'
    imsave(img_name, img)

path = '建立文件夹test的路径'
filelist = os.listdir(path)
for item in filelist:
    pathnew=os.path.join(path,item)
    imagelist = os.listdir(pathnew)
    j = 1
    for i in imagelist:
        src = os.path.join(os.path.abspath(pathnew), i)
        dst = os.path.join(os.path.abspath(pathnew), '' + item + '.' + str(j) + '.jpeg')
        j = j+1
        os.rename(src, dst)

读入数据

transforms = transforms.Compose([
    transforms.ToTensor(),
    transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))
])

train_path = r'train文件夹路径'
test_path = r'test文件夹路径'

train_dataset = datasets.ImageFolder(train_path,transform=transforms)
train_loader = DataLoader(train_dataset, batch_size=64, shuffle=True)

test_dataset = datasets.ImageFolder(test_path,transform=transforms)
test_loader = DataLoader(test_dataset , batch_size=64, shuffle=False)

搭建神经网络

深度学习的一般流程为：数据集准备，设计与搭建模型，构造损失和优化器，循环训练与测试（向前传播、反向传播、参数更新）。

卷积层（Convolutional layer）

在用全连接层处理大尺寸图像时，需要将图像展开全连接，无法获得相邻数据的特征，丢失了空间信息；并且参数过多不易训练与泛化。卷积神经网络可以很好的解决这些问题。（个人对于卷积计算的简单理解就是可以提取图像特征，然后越来越抽象）
在卷积层中，输入张量和卷积核张量通过互相关运算产生输出张量。

torch.nn.Conv2d(in_channels,out_channels,kernel_size,stride,padding)

in_channels ：输入图像通道数
out_channels ：卷积后的输出通道数
kernel_size ：卷积核尺寸；kernel_size=3，卷积核为3 _3；kernel_size=（3，4），卷积核为3_4.

stride ：每次卷积运算的步长，默认为1
padding：在输入的张量周围填充
padding = 2：

池化层（Pooling lay）

池化层可以减少数据的空间大小，参数的数量和计算量也随之减少，一般卷积神经网络之间都会插入池化层。常见的有最大池化（Max Pooling）和平均池化（Avg Pooling）。

torch.nn.MaxPool2d(kernel_size,stride,padding)

torch.nn.AvgPool2d(kernel_size,stride,padding)

kernel_size ：池化窗口的大小
stride ：每次的步长，通常为2
padding：在输入的张量周围填充

残差网络（Residual Network）

当神经网络模型层数过多的时候，会出现退化问题，即网络层数的增加，在训练集上的准确率却饱和或者下降了，这个又不能解释为过拟合，因为过拟合应该在训练集上表现更好才对。模型未能很好的被优化，靠前面的层未能得到很好的训练。

如果直接让一些层去拟合一个潜在的恒等映射函数H(x)= x，比较困难，这可能就是深层网络难以训练的原因。但是，如果把网络设计为H(x)=F(x)+ x 。我们可以转换为学习一个残差函数F(x)= H(x)一x。只要F(x)= 0，就构成了一个恒等映射H(X)= a。而且，拟合残差肯定更加容易。
F是求和前网络映射，H是从输入到求和后的网络映射。比如把5映射到5.1，那么引入残差前是F(5)=5.1，引入残差后是H(5)= 5.1，H(5)= F(5)＋5，F(5)= 0.1。这里的F’和F都表示网络参数映射，引入残差后的映射对输出的变化更敏感。比如s输出从5.1变到5.2，映射F’的输出增加了2%，而对于残差结构输出从5.1到5.2，映射F是从0.1到0.2，增加了100%。明显后者输出变化对权重的调整作用更大，所以效果更好。 残差的思想都是去掉相同的主体部分，从而突出微小的变化。

; 全连接层（Fully connected layer）

&#x5168;&#x8FDE;&#x63A5;&#x5C42;&#xFF0C;&#x662F;&#x6BCF;&#x4E00;&#x4E2A;&#x7ED3;&#x70B9;&#x90FD;&#x4E0E;&#x4E0A;&#x4E00;&#x5C42;&#x7684;&#x6240;&#x6709;&#x7ED3;&#x70B9;&#x76F8;&#x8FDE;&#xFF0C;&#x7528;&#x6765;&#x628A;&#x524D;&#x8FB9;&#x63D0;&#x53D6;&#x5230;&#x7684;&#x7279;&#x5F81;&#x7EFC;&#x5408;&#x8D77;&#x6765;&#x3002;&#x7531;&#x4E8E;&#x5176;&#x5168;&#x76F8;&#x8FDE;&#x7684;&#x7279;&#x6027;&#xFF0C;&#x4E00;&#x822C;&#x5168;&#x8FDE;&#x63A5;&#x5C42;&#x7684;&#x53C2;&#x6570;&#x4E5F;&#x662F;&#x6700;&#x591A;&#x7684;&#x3002;

其中，x1、x2、x3为全连接层的输入，a1、a2、a3为输出，

在最后使用全连接层可以进行分类。
注意：在模型的最后一个全连接层不需要使用激活函数。因为计算损失使用的是torch.nn.CrossEntropyLoss，它相当于：softmax + log + nllloss。

激活函数（Activation function）

这里使用的是：线性整流（Rectified Linear Units, ReLU）。
ReLU(x)=max(x,0)

使⽤ReLU的原因是，它求导表现得特别好：要么让参数消失，要么让参数通过。这使得优化表现得更好，并且ReLU减轻了困扰以往神经⽹络的梯度消失问题。

; 代码实现


class ResidualBlock(nn.Module):
    def __init__(self,channels):
        super(ResidualBlock, self).__init__()
        self.channels = channels
        self.conv1 = nn.Conv2d(channels,channels,kernel_size=3,padding=1)
        self.conv2 = nn.Conv2d(channels,channels,kernel_size=3,padding=1)

    def forward(self,x):
        y = F.relu(self.conv1(x))
        y = self.conv2(y)

        return F.relu(x + y)

class Net(torch.nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.conv1 = torch.nn.Conv2d(3,16,kernel_size=5)
        self.conv2 = torch.nn.Conv2d(16,32,kernel_size=5)

        self.mp = torch.nn.MaxPool2d(2)

        self.rblock1 = ResidualBlock(16)
        self.rblock2 = ResidualBlock(32)

        self.fc1 = torch.nn.Linear(800,512)
        self.fc2 = torch.nn.Linear(512, 256)
        self.fc3 = torch.nn.Linear(256, 128)
        self.fc4 = torch.nn.Linear(128, 10)

    def forward(self,x):
        batch_size = x.size(0)

        x = F.relu(self.mp(self.conv1(x)))
        x = self.rblock1(x)
        x = F.relu(self.mp(self.conv2(x)))
        x = self.rblock2(x)
        x = x.view(batch_size,-1)

        x = F.relu(self.fc1(x))
        x = F.relu(self.fc2(x))
        x = F.relu(self.fc3(x))
        x = self.fc4(x)

        return x

模型结构

; 训练与测试模型

model = Net()

损失计算

criterion = torch.nn.CrossEntropyLoss()

优化器

optimizer = optim.SGD(model.parameters(),lr=0.01,momentum=0.5)

循环训练

def train(epoch):
    running_loss = 0.0

    for batch_idx,data in enumerate(train_loader,0):
        inputs,target = data

        optimizer.zero_grad()

        outputs = model(inputs)

        loss = criterion(outputs,target)
        loss.backward()
        optimizer.step()

        running_loss += loss.item()

        if batch_idx % 300 == 299 :
            print('[%d,%5d] loss : %.3f' % (epoch + 1,batch_idx + 1,running_loss / 300))
            running_loss = 0.0

测试

def test():
    correct = 0
    total = 0
    with torch.no_grad():
        for data in test_loader:
            inputs,target = data

            outputs = model(inputs)
            _, predicted = torch.max(outputs.data,dim=1)
            total += target.size(0)
            correct += (predicted == target).sum().item()

        print('Accuracy on test set: %d %%' % (100 * correct / total))

20轮训练结果

; 保存、加载模型

保存模型

保存参数：

torch.save(model.state_dict(), "./model_parameter.pkl")

保存模型

net = Net()
torch.save(net, 'model_name.pth')

加载模型

    model = Net()
    model_path = r'./model_parameter_cpu.pkl'
    checkmodel = torch.load(model_path, 'cpu')
    model.load_state_dict(checkmodel)

实际测试效果

model_path = r'./model_parameter_cpu.pkl'
classes = ['airplane','automobile','bird','cat','deer','dog','frog','horse','ship','truck']

def prediect(img_path):

    checkmodel = torch.load(model_path, 'cpu')
    model.load_state_dict(checkmodel)
    torch.no_grad()

    img = Image.open(img_path)
    img = transforms(img).unsqueeze(0)
    outputs = model(img)

    _,predicted = torch.max(outputs,1)

    print(test_img_path)
    print('this picture maybe :', classes[predicted[0]])

if __name__ == '__main__':
    prediect(test_img_path)

运行结果：

参考

1、B站刘二大人教程：《PyTorch深度学习实践》完结合集

2、动⼿学深度学习 AstonZhang,ZacharyC.Lipton,MuLi,andAlexanderJ.Smola

3、PyTorch 实战（模型训练、模型加载、模型测试）

Original: https://blog.csdn.net/m0_54567165/article/details/127138945
Author: 不在海里的章鱼
Title: Pytorch深度学习记录：对CIFAR-10的深度学习模型搭建与测试

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/719983/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Python OpenCV配置CUDA以支持GPU加速 (不使用Visual Studio)

Welcome to My Blog 文章唯一地址：https://blog.csdn.net/REAL_liudebai/article/details/119356958 问题…

人工智能 2023年6月18日
0099
torchaudio频谱特征提取

再torchaudio中，加载和保存音频的API 是 load 和 save import torchaudio from IPython import display data,…

人工智能 2023年5月27日
0096
机器学习及其MATLAB实现——BP神经网络

Multiply its output delta and input activation to get the gradient of the weight.、 Bring t…

人工智能 2023年6月13日
0048
TinyBERT简介

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年5月28日
0063
【2023届秋招面试篇】经纬恒润自动驾驶感知算法岗位一面

下午2：00 – 3：00面的经纬恒润的感知算法岗总体情况：项目相关的所有问题全部回答出来了，语言类python和pytorch的问题没回答出来面试官挺好，双方会有…

人工智能 2023年6月1日
0069
神经网络案例编程实战

课程导语：人工智能可谓是现阶段最火的行业，在资本和技术协同支持下正在进入高速发展期。当今全球市值前五大公司都指向同一发展目标:人工智能。近几年，人工智能逐渐从理论科学落地到现实中…

人工智能 2023年7月13日
0081
pandas学习（五）merge

pandas学习（五）merge .concat() 通常用来连接DataFrame对象。默认情况下是对两个DataFrame对象进行纵向连接，当然通过设置参数，也可以通过它实现…

人工智能 2023年7月8日
0055
k8s部署mysql一主两从

解决方案部署思路部署说明软件名称软件版本mysqlv8.0.21kubernetesv20.10.17dockerv1.23.10 部署条件 1、编写namespace脚本 …

人工智能 2023年7月29日
0056
机器学习——K近邻算法及乳腺癌检测分类

一、引言 KNN 可用于分类和回归，用于分类时是多分类方法。注意:由于此方法根据预测点近邻的各类点的个数多少来确定该预测点的类别，因此原始类别数据不均衡，将严重影响最终分类效果。…

人工智能 2023年7月1日
0077
Selective Sparse Sampling for Fine-grained Image Recognition

Selective Sparse Sampling for Fine-grained Image Recognition 文章目录 * – + Selective Sp…

人工智能 2023年5月31日
0067
cv2.drawContours()、cv2.findContours()、cv2.boundingRect(img)函数用法解析

cv2.drawContours()函数的功能是绘制轮廓，输入变量如下： cv2.drawContours(image, contours, contourIdx, color, …

人工智能 2023年6月19日
00167
轻松搞懂word2vec / FastText + SVM（支持向量机）实现中英文情感分类

代码（包括数据集）链接放在文末。上一篇博客，我们介绍了如何利用几种深度学习的模型对于中文文本进行情感分类，讲的非常的详细啊，那在这里我也不过多重复与上一篇博客相同的内容，感兴趣的…

人工智能 2023年6月15日
0072
简易入手《SOM神经网络》的本质与原理

原创文章，转载请说明来自《老饼讲解神经网络》: bp.bbbdata.com 关于《老饼讲解神经网络》：本网结构化讲解神经网络的知识，原理和代码。重现matlab神经网络工具箱的算…

人工智能 2023年6月2日
0078
2021年十大开源SLAM算法整理

2021年底盘点：十大最佳开源SLAM算法该方法由慕尼黑工业大约Daniel Cremers团队提出来的纯视觉SLAM，该框架在圣诞节前开源。视频中使用的事RealsenseD4…

人工智能 2023年5月26日
0078
基于卷积神经网络和迁移学习实现场景图片分类任务

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年7月3日
0060
torchvision、torchaudio、torchtext安装：解决ModuleNotFoundError: No module named ‘torchvision‘问题

在利用torchvision包处理图象数据集时，我们发现产生了错误：ModuleNotFoundError: No module named ‘torchvision&…

人工智能 2023年7月30日
0049

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Pytorch深度学习记录：对CIFAR-10的深度学习模型搭建与测试

前言

数据集下载

; 解压与分类数据集

读入数据

卷积层（Convolutional layer）

池化层（Pooling lay）

残差网络（Residual Network）

; 全连接层（Fully connected layer）

激活函数（Activation function）

; 代码实现

模型结构

损失计算

优化器

循环训练

测试

20轮训练结果

保存模型

加载模型

大家都在看