pytorch实现ResNet50模型（小白学习，详细讲解）

2023年6月16日下午7:34 • 人工智能 • 阅读 94

参考资料

作为新手学习难免会有很多不懂的地方，以下是我参考的一些资料：
ResNet源码：https://github.com/pytorch/vision/blob/master/torchvision/models/resnet.py
源码讲解：https://www.jianshu.com/p/ec0967460d08
ResNet论文：https://arxiv.org/pdf/1512.03385.pdf
ResNet50复现：https://note.youdao.com/ynoteshare1/index.html?id=5a7dbe1a71713c317062ddeedd97d98e&type=note
ResNet50复现讲解：https://www.bilibili.com/video/BV1154y1S7WC?from=search&seid=8328821625196427671

代码实现

import torch
from torch import nn
class Bottleneck(nn.Module):

    extention=4
    def __init__(self,inplanes,planes,stride,downsample=None):
        '''

        :param inplanes: 输入block的之前的通道数
        :param planes: 在block中间处理的时候的通道数
                planes*self.extention:输出的维度
        :param stride:
        :param downsample:
        '''
        super(Bottleneck, self).__init__()

        self.conv1=nn.Conv2d(inplanes,planes,kernel_size=1,stride=stride,bias=False)
        self.bn1=nn.BatchNorm2d(planes)

        self.conv2=nn.Conv2d(planes,planes,kernel_size=3,stride=1,padding=1,bias=False)
        self.bn2=nn.BatchNorm2d(planes)

        self.conv3=nn.Conv2d(planes,planes*self.extention,kernel_size=1,stride=1,bias=False)
        self.bn3=nn.BatchNorm2d(planes*self.extention)

        self.relu=nn.ReLU(inplace=True)

        self.downsample=downsample
        self.stride=stride

    def forward(self,x):

        residual=x

        out=self.conv1(x)
        out=self.bn1(out)
        out=self.relu(out)

        out=self.conv2(out)
        out=self.bn2(out)
        out=self.relu(out)

        out=self.conv3(out)
        out=self.bn3(out)
        out=self.relu(out)

        if self.downsample is not None:
            residual=self.downsample(x)

        out+=residual
        out=self.relu(out)

        return out

class ResNet(nn.Module):
    def __init__(self,block,layers,num_class):

        self.inplane=64
        super(ResNet, self).__init__()

        self.block=block
        self.layers=layers

        self.conv1=nn.Conv2d(3,self.inplane,kernel_size=7,stride=2,padding=3,bias=False)
        self.bn1=nn.BatchNorm2d(self.inplane)
        self.relu=nn.ReLU()
        self.maxpool=nn.MaxPool2d(kernel_size=3,stride=2,padding=1)

        self.stage1=self.make_layer(self.block,64,layers[0],stride=1)
        self.stage2=self.make_layer(self.block,128,layers[1],stride=2)
        self.stage3=self.make_layer(self.block,256,layers[2],stride=2)
        self.stage4=self.make_layer(self.block,512,layers[3],stride=2)

        self.avgpool=nn.AvgPool2d(7)
        self.fc=nn.Linear(512*block.extention,num_class)

    def forward(self,x):

        out=self.conv1(x)
        out=self.bn1(out)
        out=self.relu(out)
        out=self.maxpool(out)

        out=self.stage1(out)
        out=self.stage2(out)
        out=self.stage3(out)
        out=self.stage4(out)

        out=self.avgpool(out)
        out=torch.flatten(out,1)
        out=self.fc(out)

        return out

    def make_layer(self,block,plane,block_num,stride=1):
        '''
        :param block: block模板
        :param plane: 每个模块中间运算的维度，一般等于输出维度/4
        :param block_num: 重复次数
        :param stride: 步长
        :return:
        '''
        block_list=[]

        downsample=None
        if(stride!=1 or self.inplane!=plane*block.extention):
            downsample=nn.Sequential(
                nn.Conv2d(self.inplane,plane*block.extention,stride=stride,kernel_size=1,bias=False),
                nn.BatchNorm2d(plane*block.extention)
            )

        conv_block=block(self.inplane,plane,stride=stride,downsample=downsample)
        block_list.append(conv_block)
        self.inplane=plane*block.extention

        for i in range(1,block_num):
            block_list.append(block(self.inplane,plane,stride=1))

        return nn.Sequential(*block_list)

resnet=ResNet(Bottleneck,[3,4,6,3],1000)
x=torch.randn(64,3,224,224)
X=resnet(x)
print(X.shape)

输出结果

torch.Size([64, 1000])

首先我们需要了解ResNet的原理和ResNet50的构造，如果参考我所上传的资料，完全可以搞懂。

代码讲解

这段代码是这个结构的复现。

self.conv1=nn.Conv2d(inplanes,planes,kernel_size=1,stride=stride,bias=False)
self.bn1=nn.BatchNorm2d(planes)

self.conv2=nn.Conv2d(planes,planes,kernel_size=3,stride=1,padding=1,bias=False)
elf.bn2=nn.BatchNorm2d(planes)

self.conv3=nn.Conv2d(planes,planes*self.extention,kernel_size=1,stride=1,bias=False)
self.bn3=nn.BatchNorm2d(planes*self.extention)

self.relu=nn.ReLU(inplace=True)

这是ResNet最核心的地方：

downsample是用来将残差数据和卷积数据的shape变的相同，可以直接进行相加操作。

 if self.downsample is not None:
            residual=self.downsample(x)

        out+=residual
        out=self.relu(out)

ResNet

class ResNet(nn.Module):
    def __init__(self,block,layers,num_class):

        self.inplane=64
        super(ResNet, self).__init__()

        self.block=block
        self.layers=layers

        self.conv1=nn.Conv2d(3,self.inplane,kernel_size=7,stride=2,padding=3,bias=False)
        self.bn1=nn.BatchNorm2d(self.inplane)
        self.relu=nn.ReLU()
        self.maxpool=nn.MaxPool2d(kernel_size=3,stride=2,padding=1)

        self.stage1=self.make_layer(self.block,64,layers[0],stride=1)
        self.stage2=self.make_layer(self.block,128,layers[1],stride=2)
        self.stage3=self.make_layer(self.block,256,layers[2],stride=2)
        self.stage4=self.make_layer(self.block,512,layers[3],stride=2)

        self.avgpool=nn.AvgPool2d(7)
        self.fc=nn.Linear(512*block.extention,num_class)

    def forward(self,x):

        out=self.conv1(x)
        out=self.bn1(out)
        out=self.relu(out)
        out=self.maxpool(out)

        out=self.stage1(out)
        out=self.stage2(out)
        out=self.stage3(out)
        out=self.stage4(out)

        out=self.avgpool(out)
        out=torch.flatten(out,1)
        out=self.fc(out)

        return out

    def make_layer(self,block,plane,block_num,stride=1):
        '''
        :param block: block模板
        :param plane: 每个模块中间运算的维度，一般等于输出维度/4
        :param block_num: 重复次数
        :param stride: 步长
        :return:
        '''
        block_list=[]

        downsample=None
        if(stride!=1 or self.inplane!=plane*block.extention):
            downsample=nn.Sequential(
                nn.Conv2d(self.inplane,plane*block.extention,stride=stride,kernel_size=1,bias=False),
                nn.BatchNorm2d(plane*block.extention)
            )

        conv_block=block(self.inplane,plane,stride=stride,downsample=downsample)
        block_list.append(conv_block)
        self.inplane=plane*block.extention

        for i in range(1,block_num):
            block_list.append(block(self.inplane,plane,stride=1))

        return nn.Sequential(*block_list)

这段代码实现了

 self.conv1=nn.Conv2d(3,self.inplane,kernel_size=7,stride=2,padding=3,bias=False)
        self.bn1=nn.BatchNorm2d(self.inplane)
        self.relu=nn.ReLU()
        self.maxpool=nn.MaxPool2d(kernel_size=3,stride=2,padding=1)

这段代码实现了


        self.stage1=self.make_layer(self.block,64,layers[0],stride=1)
        self.stage2=self.make_layer(self.block,128,layers[1],stride=2)
        self.stage3=self.make_layer(self.block,256,layers[2],stride=2)
        self.stage4=self.make_layer(self.block,512,layers[3],stride=2)

这段代码实现了

 self.avgpool=nn.AvgPool2d(7)
 self.fc=nn.Linear(512*block.extention,num_class)

make_layer
downsample是残差是否进行卷积的标识。

 downsample=None

if(stride!=1 or self.inplane!=plane*block.extention):
     downsample=nn.Sequential(
        nn.Conv2d(self.inplane,plane*block.extention,stride=stride,kernel_size=1,bias=False),
        nn.BatchNorm2d(plane*block.extention)
        )

Conv Block输入和输出的维度（通道数和size）是不一样的，所以不能连续串联，他的作用是改变网络的维度

conv_block=block(self.inplane,plane,stride=stride,downsample=downsample)

Identity Block 输入维度和输出（通道数和size）相同，可以直接串联，用于加深网络


        for i in range(1,block_num):
            block_list.append(block(self.inplane,plane,stride=1))

网络结构

Original: https://blog.csdn.net/m0_50127633/article/details/117200212
Author: 一个小猴子｀
Title: pytorch实现ResNet50模型（小白学习，详细讲解）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/626292/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

线性回归应用简要介绍

本文简单介绍了线形回归模型的使用场景、原理以及使用时的注意事项，下一篇会进入代码实践。目录 1、线性回归的应用场景 1.1 做预测 1.2 用来做模型解释 1.3 实验效果评估 …

人工智能 2023年6月17日
0090
rasa 介绍文档

重磅推荐专栏：《Transformers自然语言处理系列教程》手把手带你深入实践Transformers，轻松构建属于自己的NLP智能应用！ Rasa介绍 1.1 架构 Rasa…

人工智能 2023年5月30日
0080
python数据处理—-数据合并

连接数据加载多份数据连接 df1 = pd.read_csv(‘../data/concat_1.csv’) df2 = pd.read_csv(‘../data/concat_…

人工智能 2023年7月6日
0064
计算机视觉教程2-7：天使与恶魔?图文详解图像形态学运算(附代码)

目录 1 图像形态学运算 2 腐蚀 3 膨胀 4 开运算与闭运算 5 顶帽运算与底帽运算 6 恶魔与天使 1 图像形态学运算在计算机视觉教程2-2：详解图像滤波算法(附Pytho…

人工智能 2023年6月19日
0097
【人工智能全栈学习-知识图谱】零基础理论——动手学关系抽取：TextCNN&LSTM

【人工智能全栈学习-知识图谱】零基础理论——动手学关系抽取：TextCNN&LSTM 一、问题二、人工智能全栈学习系列课程三、代码文件释义四、知识图谱 * 实体、属性…

人工智能 2023年6月1日
0079
PyTorch backward原理

1，先看运行效果第一部分 x = torch.tensor([2., 1.], requires_grad=True).view(1,2) print(x) y = torch….

人工智能 2023年7月22日
0073
【毕业设计】大数据电影数据分析与可视化系统 – python Django 大数据可视化

文章目录 0 前言 1 课题背景 2 效果实现 3 爬虫及实现 4 Flask框架 5 Ajax技术 6 Echarts 7 最后 0 前言 🔥 这两年开始毕业设计和毕业答辩的要求…

人工智能 2023年7月14日
0072
实体对齐汇总

文章目录 1.综述 2.技术论文 3.汇总 * 3.1定义 – 定义统一 EA 3.2 评价指标 3.3 数据集 3.4 数据预处理技术 3.5 索引 3.6 对齐 &…

人工智能 2023年6月1日
0097
加载VGG模型进行图像分类

1、ImageNet数据集与VGG-16模型 ImageNet数据集是斯坦福大学从互联网上收集大量图片后，并对其进行分类整理而成的图像数据集合。在ILSVRC（ImageNet L…

人工智能 2023年7月3日
0083
python知识推理知识图谱_一文了解知识图谱常见的知识表示，图谱存储和查询方法…

对于知识图谱构建，有两个问题是永远绕不掉的。一个是知识图谱的知识表示，一个是知识图谱的存储方式。这两个问题大家也比较关注，而且知识图谱的表示跟知识图谱的存储还是有一定的相关性。知识…

人工智能 2023年6月1日
0081
使用VS2022手动编译OpenCV3.4.0

当需要使用高版本的vs编译低版本的opencv时可能会出现一些奇奇怪怪的错误，这时可以尝试手动编译生成opencv库文件来进行适配。编译OpenCV:opencv3.4.0源码下…

人工智能 2023年5月26日
0089
点击曝光日志的数据处理

其实pandas就是dataframe，spark里面的是一样的，有些处理方法可以相互借鉴，也可能会有SQL的一些用法，但今天就事论事，不展开。 For Recommendatio…

人工智能 2023年6月11日
0080
sentencetransformer微调（simcse模型为例）

简要介绍 sentence transformer是一个使用pytorch对常见语言模型进行封装，得到一个句子级别的embedder的python包。主要由基于transform…

人工智能 2023年7月24日
0048
TensorFlow 删除 YAML 支持，建议 JSON 作为替补方案！

TensorFlow，作为一个主流的开源 Python 库，最初由 Google 开发用于机器学习领域，逐渐成为 GitHub 顶级开源 TOP 10 项目之一。近日，Googl…

人工智能 2023年5月26日
0085
回归(平方损失)与分类[ ( BCE、CE) 和 (Focal loss) ]

回归损失与分类损失回归用于逼近某个数值，预测的结果是连续的，例如预测小明的身高，160,161,162,163cm。平方损失即MSE：分类用于预测物体属于某一个标签，预测的结果是…

人工智能 2023年7月3日
0070
Layer中的参数是什么

关于Layer中的参数是什么在深度学习中，Layer（层）是神经网络的基本组成单位。每个层都有一些可调的参数，这些参数用来构建网络并对数据进行转换。了解这些参数的作用和含义对理解…

人工智能 2024年1月6日
0054

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

pytorch实现ResNet50模型（小白学习，详细讲解）

参考资料

代码实现

输出结果

代码讲解

大家都在看