深度学习-LeNet（第一个卷积神经网络）

2023年9月15日上午9:50 • Python • 阅读 56

文章目录

简介
数据集
模型搭建
模型训练
模型测试

前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站。

简介

LeNet模型是在1998年提出的一种图像分类模型，应用于支票或邮件编码上的手写数字的识别，也被认为是最早的卷积神经网络(CNN)，为后续CNN的发展奠定了基础，作者LeCun Y也被誉为卷积神经网络之父。LeNet之后一直直到2012年的AlexNet模型在ImageNet比赛上表现优秀，使得沉寂了14年的卷积神经网络再次成为研究热点。

LeCun Y, Bottou L, Bengio Y, et al. Gradient-based learning applied to document recognition[J]. Proceedings of the IEEE, 1998, 86(11): 2278-2324.

LeNet模型结构如下：

INPUT（输入层）
输入图像的尺寸为32X32，是单通道的灰色图像。
C1（卷积层）
使用了6个大小为5×5的卷积核，步长为1，卷积后得到6张28×28的特征图。
S2（池化层）
使用了6个2×2 的平均池化，步长为2，池化后得到6张14×14的特征图。
C3（卷积层）
使用了16个大小为5×5的卷积核，步长为1，得到 16 张10×10的特征图。
由于是多个卷积核对应多个输入，论文中采用了如下组合方式：
S4（池化层）
使用16个2×2的平均池化，步长为2，池化后得到16张5×5 的特征图。
C5（卷积层）
使用120个大小为5×5的卷积核，步长为1，卷积后得到120张1×1的特征图。
F6（全连接层）
输入维度120，输出维度是84（对应7×12 的比特图）。
OUTPUT（输出层）
使用高斯核函数，输入维度84，输出维度是10（对应数字 0 到 9）。

; 数据集

使用torchversion内置的 MNIST数据集，训练集大小60000，测试集大小10000，图像大小是1×28×28，包括数字0~9共10个类。官网：http://yann.lecun.com/exdb/mnist/

from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriter
from torchvision import transforms
import torchvision

mnist_train = torchvision.datasets.MNIST(root='./datasets/',
                                         train=True, download=True, transform=transforms.ToTensor())
mnist_test = torchvision.datasets.MNIST(root='./datasets/',
                                        train=False, download=True, transform=transforms.ToTensor())
print(len(mnist_train), len(mnist_test))
feature, label = mnist_train[0]
print(feature.shape, label)
dataloader = DataLoader(mnist_test, batch_size=64, num_workers=0)
step = 0
writer = SummaryWriter(log_dir='runs/mnist')
for data in dataloader:
    features, labels = data
    writer.add_images(tag='train', img_tensor=features, global_step=step)
    step += 1
writer.close()

可视化部分可参考我这篇博客：深度学习-Tensorboard可视化面板

此外，还可以使用torchversion内置的 FashionMNIST数据集，包括衣服、包等10类图像，也是1×28×28，各60000、10000张。

模型搭建

使用Pytoch进行搭建和测试。

在第一个卷积层C1设置padding为2，因为数据集是28×28大小，原模型是32×32大小。

import torch
from torch import nn, optim

class LeNet(nn.Module):

    def __init__(self) -> None:
        super().__init__()
        self.model = nn.Sequential(
            nn.Conv2d(in_channels=1, out_channels=6, kernel_size=5, padding=2),
            nn.Sigmoid(),
            nn.AvgPool2d(kernel_size=2, stride=2),
            nn.Conv2d(in_channels=6, out_channels=16, kernel_size=5),
            nn.Sigmoid(),
            nn.AvgPool2d(kernel_size=2, stride=2),
            nn.Flatten(),
            nn.Linear(in_features=16 * 5 * 5, out_features=120),
            nn.Sigmoid(),
            nn.Linear(120, 84),
            nn.Sigmoid(),
            nn.Linear(in_features=84, out_features=10)
        )

    def forward(self, x):
        return self.model(x)

leNet = LeNet()
print(leNet)

模型训练

import torch
import torchvision
from torch.utils.data import DataLoader
from torchvision import transforms
from torch import nn
from torch.utils.tensorboard import SummaryWriter

class LeNet(nn.Module):

    def __init__(self) -> None:
        super().__init__()
        self.model = nn.Sequential(
            nn.Conv2d(in_channels=1, out_channels=6, kernel_size=5, padding=2),
            nn.Sigmoid(),
            nn.AvgPool2d(kernel_size=2, stride=2),
            nn.Conv2d(in_channels=6, out_channels=16, kernel_size=5),
            nn.Sigmoid(),
            nn.AvgPool2d(kernel_size=2, stride=2),
            nn.Flatten(),
            nn.Linear(in_features=16 * 5 * 5, out_features=120),
            nn.Sigmoid(),
            nn.Linear(120, 84),
            nn.Sigmoid(),
            nn.Linear(in_features=84, out_features=10)
        )

    def forward(self, x):
        return self.model(x)

leNet = LeNet()
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
leNet = leNet.to(device)

loss_fn = nn.CrossEntropyLoss()
loss_fn = loss_fn.to(device)

learning_rate = 1e-2
optimizer = torch.optim.Adam(leNet.parameters(), lr=learning_rate)
total_train_step = 0
epoch = 10
writer = SummaryWriter(log_dir='./runs/LeNet/')

mnist_train = torchvision.datasets.MNIST(root='./datasets/',
                                         train=True, download=True, transform=transforms.ToTensor())
mnist_test = torchvision.datasets.MNIST(root='./datasets/',
                                        train=False, download=True, transform=transforms.ToTensor())
dataloader_train = DataLoader(mnist_train, batch_size=64, num_workers=0)
dataloader_test = DataLoader(mnist_test, batch_size=64, num_workers=0)

for i in range(epoch):
    print("-----第{}轮训练开始-----".format(i + 1))
    leNet.train()
    train_loss = 0
    for data in dataloader_train:
        imgs, labels = data
        imgs = imgs.to(device)
        labels = labels.to(device)
        outputs = leNet(imgs)
        loss = loss_fn(outputs, labels)
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()
        total_train_step += 1
        train_loss += loss.item()
        writer.add_scalar("train_loss_detail", loss.item(), total_train_step)
    writer.add_scalar("train_loss_total", train_loss, i + 1)

torch.save(leNet, "./models/LeNet.pkl")

writer.close()

（插播反爬信息）博主CSDN地址：https://wzlodq.blog.csdn.net/

由于打印了每轮各个批次64张图的损失，不同批次损失不同，所以上下震荡大，但总体仍是减少收敛的。

; 模型测试

leNet.eval()
    total_test_loss = 0
    total_accuracy = 0
    with torch.no_grad():
        for data in dataloader_test:
            imgs, targets = data
            imgs = imgs.to(device)
            targets = targets.to(device)
            outputs = leNet(imgs)
            loss = loss_fn(outputs, targets)
            total_test_loss = total_test_loss + loss.item()
            accuracy = (outputs.argmax(1) == targets).sum()
            total_accuracy = total_accuracy + accuracy
    writer.add_scalar("test_loss", total_test_loss, i+1)
    writer.add_scalar("test_accuracy", total_accuracy/len(mnist_test), i+1)

随着训练轮数增加，对应模型测试的损失减少并收敛。

精确率在几轮后就趋于98%以上，就是说感受到了来自98年的科技~

最后，附完整代码：

import torch
import torchvision
from torch.utils.data import DataLoader
from torchvision import transforms
from torch import nn
from torch.utils.tensorboard import SummaryWriter

class LeNet(nn.Module):

    def __init__(self) -> None:
        super().__init__()
        self.model = nn.Sequential(
            nn.Conv2d(in_channels=1, out_channels=6, kernel_size=5, padding=2),
            nn.Sigmoid(),
            nn.AvgPool2d(kernel_size=2, stride=2),
            nn.Conv2d(in_channels=6, out_channels=16, kernel_size=5),
            nn.Sigmoid(),
            nn.AvgPool2d(kernel_size=2, stride=2),
            nn.Flatten(),
            nn.Linear(in_features=16 * 5 * 5, out_features=120),
            nn.Sigmoid(),
            nn.Linear(120, 84),
            nn.Sigmoid(),
            nn.Linear(in_features=84, out_features=10)
        )

    def forward(self, x):
        return self.model(x)

leNet = LeNet()
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
leNet = leNet.to(device)

loss_fn = nn.CrossEntropyLoss()
loss_fn = loss_fn.to(device)

learning_rate = 1e-2
optimizer = torch.optim.Adam(leNet.parameters(), lr=learning_rate)
total_train_step = 0
epoch = 10
writer = SummaryWriter(log_dir='./runs/LeNet/')

mnist_train = torchvision.datasets.MNIST(root='./datasets/',
                                         train=True, download=True, transform=transforms.ToTensor())
mnist_test = torchvision.datasets.MNIST(root='./datasets/',
                                        train=False, download=True, transform=transforms.ToTensor())
dataloader_train = DataLoader(mnist_train, batch_size=64, num_workers=0)
dataloader_test = DataLoader(mnist_test, batch_size=64, num_workers=0)

for i in range(epoch):
    print("-----第{}轮训练开始-----".format(i + 1))
    leNet.train()
    train_loss = 0
    for data in dataloader_train:
        imgs, labels = data
        imgs = imgs.to(device)
        labels = labels.to(device)
        outputs = leNet(imgs)
        loss = loss_fn(outputs, labels)
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()
        total_train_step += 1
        train_loss += loss.item()
        writer.add_scalar("train_loss", loss.item(), total_train_step)
    writer.add_scalar("train_loss", train_loss, i + 1)
    leNet.eval()
    total_test_loss = 0
    total_accuracy = 0
    with torch.no_grad():
        for data in dataloader_test:
            imgs, targets = data
            imgs = imgs.to(device)
            targets = targets.to(device)
            outputs = leNet(imgs)
            loss = loss_fn(outputs, targets)
            total_test_loss = total_test_loss + loss.item()
            accuracy = (outputs.argmax(1) == targets).sum()
            total_accuracy = total_accuracy + accuracy
    writer.add_scalar("test_loss", total_test_loss, i+1)
    writer.add_scalar("test_accuracy", total_accuracy/len(mnist_test), i+1)
torch.save(leNet, "./models/LeNet.pkl")

writer.close()

原创不易，请勿转载（本不富裕的访问量雪上加霜）
博主首页：https://wzlodq.blog.csdn.net/
来都来了，不评论两句吗👀
如果文章对你有帮助，记得一键三连❤

Original: https://blog.csdn.net/qq_45034708/article/details/128319241
Author: 吾仄lo咚锵
Title: 深度学习-LeNet（第一个卷积神经网络）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/777068/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

python中的字典和集合

字典的常见操作 2. 字典的遍历循环 3. 集合的常见操作 1.字典存储数据存储一个数据的属性可以快速进行查找 dict_data = {key:value,key:valu…

Python 2023年10月30日
0042
Pygame:外星人入侵

《python编程从入门到实践》（第二版）实践项目1：pygame游戏：外星人入侵文档说明： 游戏主&…

Python 2023年9月18日
0058
Python实现批量将文件按分类保存，文件再多，只需一秒钟解决

当我们电脑里面的文本或者或者文件夹太多了，有时候想找到自己想要的文件，只能通过去搜索文件名，要是名字忘记了的话，那你也搜不了吧，当然你可通过后缀名去搜索，但是通过搜索出来的文件只会…

Python 2023年11月3日
0054
k-means聚类（python代码）

k-means 聚类接下来是进入聚类算法的的学习，聚类算法属于无监督学习，与分类算法这种有监督学习不同的是，聚类算法事先并不需要知道数据的类别标签，而只是根据数据特征去学习，找到…

Python 2023年8月2日
0053
第十届软件杯（民航大数据在线可视化分析系统）

信息化与互联网的浪潮正冲击着社会的各个角落，而航空”数据化”越来越被重视，它已经被誉为是新时代的”石油和原材料”，成为企业未来发展的…

Python 2023年8月9日
0056
判断二叉树是否为满二叉树

原文地址：满二叉树定义一个二叉树，如果每一个层的结点数都达到最大值，则这个二叉树就是满二叉树。也就是说，如果一个二叉树的层数为K，且结点总数是 (2^k) -1 ，则它就是满二…

Python 2023年10月13日
0044
python——scrapy利用cookie模拟登录

python——scrapy利用cookie模拟登录适用场景：cookie过期时间较长，足够你完成爬取过程文章目录 1、基础 2、找cookie，改start_urls 3、co…

Python 2023年10月2日
0045
Python入门系列（七）开发常说的“累”与“对象”

类与对象 Python是一种面向对象的编程语言。要创建类，请使用关键字class class MyClass: x = 5 创建一个名为p1的对象，并打印x的值 p1 = MyC…

Python 2023年10月23日
0039
视频实时行为检测——基于yolov5+deepsort+slowfast算法

文章目录前言一、核心功能设计二、核心实现步骤 * 1.yolov5实现目标检测 2.deepsort实现目标跟踪 3.slowfast动作识别三、核心代码解析 * 1.参数…

Python 2023年10月9日
0081
MySQL高可用之MHA架构企业实战

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。 Original: https://blo…

Python 2023年11月7日
0036
命名空间+作用域

Python 2023年5月24日
0079
Python入门初学二、Python下载/安装/环境配置/模块安装/解决pip下载模块慢

兄弟们，既然要学python，那么这些软件是需要先安装一下的。一、Python 下载Python是运行的环境，必不可少，如果你是Linux系统的话，不用安装，自带了Python。…

Python 2023年9月24日
0064
Java/JavaScript/Python字符串常用方法

Java/JavaScript/Python字符串常用方法 Java JavaScript Python 比较字符串是否相等转换为字符数组 s.toCharArray() s.s…

Python 2023年6月3日
0069
Python-项目实战-《外星人入侵》Pygame小游戏-阶段一:武装飞船（含教程）

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

Python 2023年9月18日
0055
JS模块化

模块化规范 1.CommonJS规范在node中，默认支持的模块化规范叫做CommonJS，在CommonJS中，一个js文件就是一个模块 CommonJS规范引入模…

Python 2023年10月13日
0037
Qt编写视频监控系统67-录像计划（支持64通道7*24录像设置）

一、前言录像计划这个功能一直挂了很久，之前做的也都有保存视频文件功能，其中还分了三大种，第一种是手动开启和停止录像；第二种是按照指定时长比如10s保存文件；第三种是定时30分钟一…

Python 2023年10月8日
0055

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

深度学习-LeNet（第一个卷积神经网络）

文章目录

大家都在看