pytorch实现LeNet5分类CIFAR10

2023年6月4日下午1:52 • 人工智能 • 阅读 90

关于LeNet-5

LeNet5的Pytorch实现在网络上已经有很多了，这里记录一下自己的实现方法。

LeNet-5出自于Gradient-Based Learning Applied to Document Recognition中，被用于手写数字识别，也是首批在图像识别中运用了卷积的网络。LeNet-5的网络结果如下：

从这个网络结构图中可以看出，网络首先经过了卷积、池化、卷积、池化、全连接、全连接。接下来对这些层做一些解释。

网络结构

第一次卷积 LeNet-5的第一次卷积采用了55的卷积核，卷积的filters为6，步长为1，padding为0，经过这样的一次卷积，32323的输入图片就变成了2828*6的特征图（feature map），这里长、宽和通道的变化可以由卷积的各项参数得到，如28=(32-5+1)/1，通道3变成6是因为卷积的filters数为6
第一次池化在经过第一次卷积之后，这里经过了一次池化的操作，特征图的长宽减半，通道数不变，这样特征图的尺寸就变成了14146，池化的目的是为了减小特征图的大小，减少计算量
第二次卷积第二次卷积同样采用了55的卷积核，卷积的filters数为16，步长为1，padding为0，经过该卷积层的特征图变为了1010*16
第二次池化这里需要经过一层的池化，同样图的长宽减半，变为了5516
第一次全连接全连接层是将一张图片的所有的像素都连接起来，我们从上面得知，上层卷积得到的特征图为5516，就可以算出一共有5516=400个像素，则输入为400个特征，根据论文的定义，该全连接层输出120个特征
第二次全连接同上，该层输入了120个特征，输出了84个特征
第三次全连接该层输入了84个特征，输出了10个特征，对应了CIFAR10数据集需要分10类

网络的pytorch代码如下：

class LeNet(nn.Module):
    def __init__(self):
        super(LeNet, self).__init__()
        # 第一层卷积
        self.conv_1 = nn.Conv2d(3, 6, (5, 5), stride=1, padding=0)
        # 第二层池化
        self.pool_1 = nn.AvgPool2d(kernel_size=(2, 2), stride=2, padding=0)
        # 第三层卷积
        self.conv_2 = nn.Conv2d(6, 16, (5, 5), stride=1, padding=0)
        # 第四层池化
        self.pool_2 = nn.AvgPool2d(kernel_size=(2, 2), stride=2, padding=0)
        # 第七层全连接
        self.linear_1 = nn.Linear(16 * 8 * 8, 120)
        # 第八层全连接
        self.linear_2 = nn.Linear(120, 84)
        # 第九层全连接
        self.linear_3 = nn.Linear(84, 10)
        self.relu = nn.ReLU(inplace=True)
        self.sigmoid = nn.Sigmoid()
        self.tanh = nn.Tanh()

    def forward(self, x):
        x_c1 = self.relu(self.conv_1(x))
        x_p1 = self.pool_1(x_c1)
        x_c2 = self.relu(self.conv_2(x_p1))
        x_p2 = self.pool_2(x_c2)
        x_c3 = x_p2.view(x_p2.size(0), -1)
        x_l1 = self.relu(self.linear_1(x_c3))
        x_l2 = self.relu(self.linear_2(x_l1))
        x_l3 = self.linear_3(x_l2)
        return x_l3

数据集

LeNet-5当初设计出来是为了分类手写数据集，所以理论上MINST手写数据集会更加的适合它，但是这里我还是选择了CIFAR10数据集来测试LeNet-5网络。

CIFAR10数据集可以在pytorch中很方便的调用，但是处于练习pytorch的目的，这里手动下载了CIFAR10数据集，然后手写了读取数据集的相关类。

CIFAR10数据集可以在其官网下载，链接如下：http://www.cs.toronto.edu/~kriz/cifar-10-python.tar.gz

大家下载后，并不是一个个的图片，而是一个二进制的文件，图片的数据就包含在其中，需要利用相关的代码将这个二进制的文件转为图片文件。下面放出相关的代码：

-*- coding: utf-8 -*-
import imageio
import numpy as np
import pickle
import os

if not os.path.exists("./cifar10/train"):
    os.makedirs("./cifar10/train")
if not os.path.exists("./cifar10/test"):
    os.makedirs("./cifar10/test")

def load_file(filename):
    with open(filename, 'rb') as f:
        data = pickle.load(f, encoding='latin1')
    return data

生成训练集图片，如果需要png格式，只需要改图片后缀名即可。
for j in range(1, 6):
    dataName = "data_batch_" + str(j)  # 读取当前目录下的data_batch12345文件，dataName其实也是data_batch文件的路径，本文和脚本文件在同一目录下。
    Xtr = load_file('./cifar10/'+dataName)
    print(dataName + " is loading...")

    for i in range(0, 10000):
        img = np.reshape(Xtr['data'][i], (3, 32, 32))  # Xtr['data']为图片二进制数据
        img = img.transpose(1, 2, 0)  # 读取image
        picName = './cifar10/train/' + str(Xtr['labels'][i]) + '_' + str(i + (j - 1)*10000) + '.jpg'  # Xtr['labels']为图片的标签，值范围0-9，本文中，train文件夹需要存在，并与脚本文件在同一目录下。
        imageio.imwrite(picName, img)
    print(dataName + " loaded.")

print("test_batch is loading...")

生成测试集图片
testXtr = load_file('./cifar10/test_batch')
for i in range(0, 10000):
    img = np.reshape(testXtr['data'][i], (3, 32, 32))
    img = img.transpose(1, 2, 0)
    picName = './cifar10/test/' + str(testXtr['labels'][i]) + '_' + str(i) + '.jpg'
    imageio.imwrite(picName, img)
print("test_batch loaded.")

运行上面的代码后，大家就可以得到train和test两个文件夹的图片，其类别是通过文件名来判断的。

根据该CIFAR10数据集，就可以写出读取数据集的相关类了，代码如下：

class Cifar10Dataset(Dataset):
    def __init__(self, img_path, transform=None, target_transform=None):
        self.imgs = []
        img_list = os.listdir(img_path)
        for i in img_list:
            label = i.split('_')[0]
            self.imgs.append({'label': label, "img": os.path.join(img_path, i)})
        self.transform = transform
        self.target_transform = target_transform

    def __getitem__(self, index):
        data = self.imgs[index]
        # label = [0.0]*10
        # label[int(data['label'])] = 1.0
        label = float(data['label'])
        img_path = data['img']
        img = Image.open(img_path).convert('RGB')
        if self.transform is not None:
            img = self.transform(img)
        return label, img

    def __len__(self):
        return len(self.imgs)

其中 __getitem__和 __len__是继承自 Dataset类，分别用于获取一个数据和获取数据集的长度。

定义了Dataset接下来就可以定义dataloader了，定义如下：

cifar_train = dataset.Cifar10Dataset('./cifar10/train', transform=transforms.Compose([
    transforms.Resize((32, 32)),
    transforms.ToTensor(),
    transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))
]))
cifar_test = dataset.Cifar10Dataset('./cifar10/test', transform=transforms.Compose([
    transforms.Resize((32, 32)),
    transforms.ToTensor(),
    transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))
]))

cifar_train_loader = DataLoader(cifar_train, batch_size=batch_size, shuffle=True)
cifar_test_loader = DataLoader(cifar_test, batch_size=batch_size, shuffle=False)

其中的transform为将提取出的图片做何种处理，在本段代码中，进行了调整大小、转为Tensor变量和归一化的处理，这里要注意，归一化需要在tensor之后。

训练

接下来就编写train的代码，直接将代码放出

import torch
import torch.nn as nn
from torchvision import datasets, transforms
from torch.utils.data import DataLoader
import torch.optim as optim
from tensorboardX import SummaryWriter
import dataset
from model import LeNet
from torch.optim.lr_scheduler import StepLR

write = SummaryWriter('result')

batch_size = 71680
epoch_num = 200

cifar_train = dataset.Cifar10Dataset('./cifar10/train', transform=transforms.Compose([
    transforms.Resize((32, 32)),
    transforms.ToTensor(),
    transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))
]))
cifar_test = dataset.Cifar10Dataset('./cifar10/test', transform=transforms.Compose([
    transforms.Resize((32, 32)),
    transforms.ToTensor(),
    transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))
]))

cifar_train_loader = DataLoader(cifar_train, batch_size=batch_size, shuffle=True)
cifar_test_loader = DataLoader(cifar_test, batch_size=batch_size, shuffle=False)

label, img = iter(cifar_train_loader).next()

criteon=nn.CrossEntropyLoss()
device=torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
print(device)
net=LeNet().to(device)
write.add_graph(net)
optimizer=optim.Adam(net.parameters(), lr=1e-2)
scheduler = StepLR(optimizer, step_size=100, gamma=0.1)

print(net)
for epoch in range(epoch_num):
    for batchidx, (label, img) in enumerate(cifar_train_loader):
        net.train()
        logits = net(img.to(device))
        loss = criteon(logits, label.long().to(device))
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()
        scheduler.step()
    print("epoch:{} loss:{}".format(epoch, loss.item()))
    write.add_scalar(tag='train_loss', global_step=epoch, scalar_value=loss.item())

    net.eval()
    with torch.no_grad():
        total_num = 0
        total_correct = 0
        for label, img in cifar_test_loader:
            logits = net(img.to(device))
            pred = logits.argmax(dim=1)
            total_correct += torch.eq(label.to(device), pred).float().sum()
            total_num += img.size(0)
        acc = total_correct / total_num
        print("EVAL--epoch:{}  acc:{} Lr:{}".format(epoch, acc, optimizer.state_dict()['param_groups'][0]['lr']))
        write.add_scalar(tag="eval_acc", global_step=epoch, scalar_value=acc)
        write.add_scalar(tag="Learning Rate", global_step=epoch, scalar_value=optimizer.state_dict()['param_groups'][0]['lr'])

在train的时候，你需要更改你自己电脑的显卡水平来调整batch_size的大小，运行即可开始训练。

详细的代码可以在我的github仓库看到

文章若有错误，欢迎联系我或在评论中指出😉

Original: https://www.cnblogs.com/c-chenbin/p/14774817.html
Author: _CHENBIN
Title: pytorch实现LeNet5分类CIFAR10

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/568204/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【tensorflow2.6】图片数据建模流程：猫狗分类，83.6%识别率

目标：识别猫和狗文章目录 * – 一、猫狗数据集 – 二、训练环境 – 三、数据处理 – 四、建立模型 – 五、图像处…

人工智能 2023年6月30日
00132
einsum函数介绍-张量常用操作

pytorch文档说明：(torch.einsum(equation, operands)) 使用基于爱因斯坦求和约定的符号，将输入operands的元素沿指定的维数求和。eins…

人工智能 2023年6月4日
0083
VScode中使用Rainbow导入马老师语音包（有了马老师，码代码不再孤单）

今日逛GitHub发现了一个有关马老师（保国老师）的项目，原本以为是恶搞，正准备点进去一个左正蹬、一个右边腿批判一顿，没想到居然是一个爱党、爱国家、爱民族、爱家的好项目。Rainb…

人工智能 2023年5月27日
00162
清华源conda 安装gpu版本的pytorch总是推送cpu版本解决办法

方法一 1.用conda list 看看有没有cpuonly这个包，有的话删掉，这个包是装不上gpu版本的罪魁祸首。 conda uninstall cpuonly 2.装pyto…

人工智能 2023年7月26日
0094
Dataframe按行按列遍历的几种方式

遍历数据有以下三种方法：目录按行遍历iterrows(): 按行遍历itertuples(): 按列遍历iteritems(): 简单对上面三种方法进行说明： iterr…

人工智能 2023年7月6日
0094
Apache Jmeter BeanShell 实现跨文件跨线程全自动获取Token并写入CSV文件

系列文章目录 提示：阅读本&#x7AE0…

人工智能 2023年6月27日
0097
警惕AI，我搭建了一个“枪枪爆头”的视觉AI自瞄程序，却引发了一场“山雨欲来”

前言前段时间在网上看到《警惕AI外挂！我写了一个枪枪爆头的视觉AI，又亲手”杀死”了它》这个视频，引起了我极大的兴趣。视频中提到，在国外有人给使命召唤做…

人工智能 2023年6月23日
00568
山东大学类脑实验五 HMAX 模型实现

山东大学类脑实验五 HMAX 模型实现实验目的：加深对 HMAX 模型的理解，能够使用 HMAX 模型解决简单问题实验内容：根据 HMAX 模型的相关知识，使用 Pyth…

人工智能 2023年6月25日
0081
深度学习中的随机种子torch.manual_seed(number)、torch.cuda.manual_seed(number)

训练模型过程中，会遇到很多的随机性设置，设置随机性并多次实验的结果更加有说服力。但是现在发论文越来越要求模型的可复现性，这时候不得不控制代码的随机性问题且每次随机的初始权重一样，有…

人工智能 2023年5月26日
0085
【python技能树】python程序设计思想

0 Python编程思想 Python是一种面向对象 oop(Object Oriented Programming)的脚本语言。面向对象是采用基于对象（实体）的概念建立模型，模…

人工智能 2023年7月4日
0069
数据分析：数据处理篇5（1）

多层索引那些事（上）多层索引简介多层索引的创建又和大家见面了，不知道之前的内容大家笑话的怎么样了。这一期就和大家聊聊多层索引的那些事。多层索引简介多层索引是Pandas中…

人工智能 2023年7月8日
0068
pythonslice_shift_Pandas 解决dataframe的一列进行向下顺移问题

最近做比赛，有时候需要造出新的特征，而这次遇到的问题是将一列数据往下顺移一位。同时将开头缺失的那一个数据用其他方式填充。 df[‘feature’].shi…

人工智能 2023年7月7日
0050
旅游地图制作_电影桥段照进现实！百度地图里的声音也能私人订制了

“燕子，没有你我怎么活啊！” 2016年《从你的全世界路过》上映后，岳云鹏和燕子的”捆绑程度”持续至今。但很多观众的纸巾，都献给了影…

人工智能 2023年5月27日
0079
使用Tableau进行基础图表制作

前言本博客中使用的数据文件放在文章的末尾，如果本文对您有所帮助的话，希望能够得到您一个小小的点赞谢谢！ 1、柱形图在Tableau中可以创建分层结构，将不同的维度放入分层结构中…

人工智能 2023年7月18日
00153
python中list列表删除元素的4种方法

在python列表中删除元素主要分为以下3种场景：根据目标元素所在的索引位置进行删除，可以使用del关键字或pop()方法；根据元素本身的值进行删除，可使用列表（list类型）…

人工智能 2023年7月4日
00103
data mining 聚类思维导图

一、划分聚类1.K-means经典算法，指定k为最后分裂保留的簇的个数。①n个样本，随机选择k个样本作为初始簇的中心。②计算每个样本距离k个簇中心的距离，把它加入到距离自己最近的簇…

人工智能 2023年6月2日
0078

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

pytorch实现LeNet5分类CIFAR10

关于LeNet-5

网络结构

数据集

训练

大家都在看