【pytorch】ResNet18、ResNet20、ResNet34、ResNet50网络结构与实现

2023年6月16日下午1:25 • 人工智能 • 阅读 84

文章目录

ResNet主体
BasicBlock
*
ResNet18
ResNet34
ResNet20
Bottleneck Block
*
ResNet50
ResNet到底解决了什么问题

选取经典的早期Pytorch官方实现代码进行分析

https://github.com/pytorch/vision/blob/9a481d0bec2700763a799ff148fe2e083b575441/torchvision/models/resnet.py
各种ResNet网络是由BasicBlock或者bottleneck构成的，它们是构成深度残差网络的基本模块

ResNet主体

【pytorch】ResNet18、ResNet20、ResNet34、ResNet50网络结构与实现

ResNet的大部分各种结构是1层conv+4个block+1层fc

class ResNet(nn.Module):

    def __init__(self, block, layers, zero_init_residual=False):
        super(ResNet, self).__init__()
        self.inplanes = 64
        self.conv1 = nn.Conv2d(3, 64, kernel_size=7, stride=2, padding=3,
                               bias=False)
        self.bn1 = nn.BatchNorm2d(64)
        self.relu = nn.ReLU(inplace=True)
        self.maxpool = nn.MaxPool2d(kernel_size=3, stride=2, padding=1)
        self.layer1 = self._make_layer(block, 64, layers[0])
        self.layer2 = self._make_layer(block, 128, layers[1], stride=2)
        self.layer3 = self._make_layer(block, 256, layers[2], stride=2)
        self.layer4 = self._make_layer(block, 512, layers[3], stride=2)
        self.avgpool = nn.AdaptiveAvgPool2d((1, 1))
        self.fc = nn.Linear(512 * block.expansion, num_classes)
        for m in self.modules():
            if isinstance(m, nn.Conv2d):
                nn.init.kaiming_normal_(m.weight, mode='fan_out', nonlinearity='relu')
            elif isinstance(m, nn.BatchNorm2d):
                nn.init.constant_(m.weight, 1)
                nn.init.constant_(m.bias, 0)

        if zero_init_residual:
            for m in self.modules():
                if isinstance(m, Bottleneck):
                    nn.init.constant_(m.bn3.weight, 0)
                elif isinstance(m, BasicBlock):
                    nn.init.constant_(m.bn2.weight, 0)

    def _make_layer(self, block, planes, blocks, stride=1):
        downsample = None
        if stride != 1 or self.inplanes != planes * block.expansion:

            downsample = nn.Sequential(
                conv1x1(self.inplanes, planes * block.expansion, stride),
                nn.BatchNorm2d(planes * block.expansion),
            )

        layers = []
        layers.append(block(self.inplanes, planes, stride, downsample))
        self.inplanes = planes * block.expansion
        for _ in range(1, blocks):

            layers.append(block(self.inplanes, planes))

        return nn.Sequential(*layers)

    def forward(self, x):
        x = self.conv1(x)
        x = self.bn1(x)
        x = self.relu(x)
        x = self.maxpool(x)

        c2 = self.layer1(x)
        c3 = self.layer2(c2)
        c4 = self.layer3(c3)
        c5 = self.layer4(c4)
        x = self.avgpool(x)
        x = x.view(x.size(0), -1)
        x = self.fc(x)
        return c5

需要注意的是最后的avgpool是全局的平均池化

BasicBlock

class BasicBlock(nn.Module):
    expansion = 1

    def __init__(self, inplanes, planes, stride=1, downsample=None):

        super(BasicBlock, self).__init__()
        self.conv1 = conv3x3(inplanes, planes, stride)
        self.bn1 = nn.BatchNorm2d(planes)
        self.relu = nn.ReLU(inplace=True)
        self.conv2 = conv3x3(planes, planes)
        self.bn2 = nn.BatchNorm2d(planes)
        self.downsample = downsample
        self.stride = stride

    def forward(self, x):
        identity = x

        out = self.conv1(x)
        out = self.bn1(out)
        out = self.relu(out)

        out = self.conv2(out)
        out = self.bn2(out)

        if self.downsample is not None:
            identity = self.downsample(x)

        out += identity
        out = self.relu(out)

        return out

图1. BasicBlock结构图1

ResNet18

对应的就是[2,2,2,2]

def resnet18(pretrained=False, **kwargs):
    """Constructs a ResNet-18 model.

    Args:
        pretrained (bool): If True, returns a model pre-trained on ImageNet
"""
    model = ResNet(BasicBlock, [2, 2, 2, 2], **kwargs)
    if pretrained:
        print('Loading the pretrained model ...')

        model.load_state_dict(model_zoo.load_url(model_urls['resnet18']), strict=False)
    return model

ResNet34

def resnet34(pretrained=False, **kwargs):
    """Constructs a ResNet-34 model.

    Args:
        pretrained (bool): If True, returns a model pre-trained on ImageNet
"""
    model = ResNet(BasicBlock, [3, 4, 6, 3], **kwargs)
    if pretrained:
        print('Loading the pretrained model ...')
        model.load_state_dict(model_zoo.load_url(model_urls['resnet34']), strict=False)
    return model

ResNet20

这个需要强调一下,正常的ResNet20应该是文章中提出，针对cifar数据集设计的n=3时候, 1+6*3+1=20

class ResNet4Cifar(nn.Module):
    def __init__(self, block, num_block, num_classes=10):
        super().__init__()
        self.in_channels = 16
        self.conv1 = nn.Sequential(
            nn.Conv2d(3, 16, kernel_size=3, padding=1, bias=False),
            nn.BatchNorm2d(16),
            nn.ReLU(inplace=True))

        self.conv2_x = self._make_layer(block, 16, num_block[0], 1)
        self.conv3_x = self._make_layer(block, 32, num_block[1], 2)
        self.conv4_x = self._make_layer(block, 64, num_block[2], 2)
        self.avg_pool = nn.AdaptiveAvgPool2d((1, 1))
        self.fc = nn.Linear(64 * block.expansion, num_classes)

    def _make_layer(self, block, out_channels, num_blocks, stride):
        strides = [stride] + [1] * (num_blocks - 1)
        layers = []
        for stride in strides:
            layers.append(block(self.in_channels, out_channels, stride))
            self.in_channels = out_channels * block.expansion
        return nn.Sequential(*layers)

    def forward(self, x):
        output = self.conv1(x)
        output = self.conv2_x(output)
        output = self.conv3_x(output)
        output = self.conv4_x(output)
        output = self.avg_pool(output)
        output = output.view(output.size(0), -1)
        output = self.fc(output)
        return output

def resnet20(num_classes=10, **kargs):
    """ return a ResNet 20 object
"""
    return ResNet4Cifar(BasicBlock, [3, 3, 3], num_classes=num_classes)

我们通过参数量的计算也为0.27M，和论文中的一致，对[1,3,32,32]的输入，输出维度为[1,64,8,8]

图2 ResNet20参数量计算

但是也有一些文章只换了开头三层的3×3卷积层，通道数并没有采用16、32、64，仍是4层的64、128、256、512
，这样下来参数量是11.25M。针对的任务不同，但是如果不关注原始网络结构，这一点可以忽略。

Bottleneck Block

Bottleneck Block中使用了1×1卷积层。如输入通道数为256，1×1卷积层会将通道数先降为64，经过3×3卷积层后，再将通道数升为256。1×1卷积层的优势是在更深的网络中，用较小的参数量处理通道数很大的输入。
这种结构用在ResNet50、ResNet101中。

图2. Bottleneck 结构图1

class Bottleneck(nn.Module):
    expansion = 4

    def __init__(self, inplanes, planes, stride=1, downsample=None):
        super(Bottleneck, self).__init__()
        self.conv1 = conv1x1(inplanes, planes)
        self.bn1 = nn.BatchNorm2d(planes)
        self.conv2 = conv3x3(planes, planes, stride)
        self.bn2 = nn.BatchNorm2d(planes)
        self.conv3 = conv1x1(planes, planes * self.expansion)
        self.bn3 = nn.BatchNorm2d(planes * self.expansion)
        self.relu = nn.ReLU(inplace=True)
        self.downsample = downsample
        self.stride = stride

    def forward(self, x):
        identity = x

        out = self.conv1(x)
        out = self.bn1(out)
        out = self.relu(out)

        out = self.conv2(out)
        out = self.bn2(out)
        out = self.relu(out)

        out = self.conv3(out)
        out = self.bn3(out)

        if self.downsample is not None:
            identity = self.downsample(x)

        out += identity
        out = self.relu(out)

        return out

ResNet50

图3. ResNet50结构图2

和以上的网络结构一样，把Bottleneck按层数堆起来就可以了

def resnet50(pretrained=False, **kwargs):
    """Constructs a ResNet-50 model.

    Args:
        pretrained (bool): If True, returns a model pre-trained on ImageNet
"""
    model = ResNet(Bottleneck, [3, 4, 6, 3], **kwargs)
    if pretrained:
        print('Loading the pretrained model ...')
        model.load_state_dict(model_zoo.load_url(model_urls['resnet50']), strict=False)
    return model

ResNet到底解决了什么问题

推荐看知乎问题Resnet到底在解决一个什么问题呢？
贴一些我比较喜欢的回答：

A. 对于L L L层的网络来说，没有残差表示的Plain Net梯度相关性的衰减在1 2 L \frac{1}{2^L}2 L 1 ，而ResNet的衰减却只有1 L \frac{1}{\sqrt{L}}L 1 。即使BN过后梯度的模稳定在了正常范围内，但梯度的相关性实际上是随着层数增加持续衰减的。而经过证明，ResNet可以有效减少这种相关性的衰减。

B. 对于”梯度弥散”观点来说，在输出引入一个输入x的恒等映射，则梯度也会对应地引入一个常数1，这样的网络的确不容易出现梯度值异常，在某种意义上，起到了稳定梯度的作用。

C. 跳连接相加可以实现不同分辨率特征的组合，因为浅层容易有高分辨率但是低级语义的特征，而深层的特征有高级语义，但分辨率就很低了。引入跳接实际上让模型自身有了更加”灵活”的结构，即在训练过程本身，模型可以选择在每一个部分是”更多进行卷积与非线性变换”还是”更多倾向于什么都不做”，抑或是将两者结合。模型在训练便可以自适应本身的结构。3

D. 当使用了残差网络时,就是加入了skip connection 结构,这时候由一个building block 的任务由: F(x) := H(x)，变成了F(x) := H(x)-x对比这两个待拟合的函数, 拟合残差图更容易优化,也就是说:F(x) := H(x)-x比F(x) := H(x)更容易优化4. 举了一个差分放大器的例子：F是求和前网络映射，H是从输入到求和后的网络映射。比如把5映射到5.1，那么引入残差前是F'(5)=5.1，引入残差后是H(5)=5.1, H(5)=F(5)+5, F(5)=0.1。这里的F’和F都表示网络参数映射，引入残差后的映射对输出的变化更敏感。比如s输出从5.1变到5.2，映射F’的输出增加了1/51=2%，而对于残差结构输出从5.1到5.2，映射F是从0.1到0.2，增加了100%。明显后者输出变化对权重的调整作用更大，所以效果更好。残差的思想都是去掉相同的主体部分，从而突出微小的变化。

说法众多，好用就完事儿了嗷~

Original: https://blog.csdn.net/a_piece_of_ppx/article/details/125960098
Author: leSerein_
Title: 【pytorch】ResNet18、ResNet20、ResNet34、ResNet50网络结构与实现

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/624378/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

毕设题目：Matlab交通标志识别

1 案例背景交通标志识别技术是智能交通和自动驾驶领域中的一项关键性技术,如何建立一个准确性高、实时性好以及安全性佳的交通标志识别系统是当下一大研究热点。在简要介绍该系统框架和比较已…

人工智能 2023年6月20日
0098
张量有哪些常见的表示方式

张量的常见表示方式在数学和计算机科学中，张量是一种广义的向量和矩阵的扩展，可以表示和处理多维数据。张量在机器学习和深度学习等领域中扮演着重要的角色。张量可以通过多种方式进行表示，…

人工智能 2024年1月1日
0048
python消消乐美轮美奂的界面效果【完整源码+详细流程】

效果是这样的 ↓ ↓ ↓ 一、环境要求 windows系统，python3.6+ pip21+ 二、游戏简介消消乐应该大家都玩过，或者看过。这个花里胡哨的小游戏用python的…

人工智能 2023年7月5日
0039
史上最全SQL基础知识总结(理论+举例)

SQL基础知识一、SQL 概述 * 1、什么是 SQL 2、语法要求二、SQL 分类三、DDL（Data Definition Language）：数据定义语言 * 基本操作…

人工智能 2023年7月29日
0066
SQL数据分析常用案例总结

row_number() over() datediff()函数求最近一次的xx，sql模板，例如获取cookie最近一次访问日期 — step01 先&…

人工智能 2023年6月11日
0075
Pytorch3D Linux环境下安装（踩坑）记录

Pytorch3D Linux环境下安装（踩坑）记录文章目录一、准备工作二、极简安装（Installing prebuilt binaries） 1.创建环境 2.安装Pyt…

人工智能 2023年6月24日
0070
什么是 ClickHouse（实时数据分析数据库）

目录什么是 ClickHouse * 软件介绍 – 简介市场环境目前国内社区火热，各个大厂纷纷跟进大规模使用：特点优点 – 1、真正的面向列的DB…

人工智能 2023年7月16日
0080
[Python] 字典操作近两万字大总结（超详细教程）

🔥 信仰：一个人走得远了，就会忘记自己为了什么而出发，希望你可以不忘初心，不要随波逐流，一直走下去🦋 欢迎关注🖱点赞👍收藏🌟留言🐾🦄 本文由程序喵正在路上原创，CSDN首发！…

人工智能 2023年7月6日
0042
（ICCV-2019）用于视频识别的 SlowFast 网络

用于视频识别的 SlowFast 网络 paper题目：SlowFast Networks for Video Recognition paper是FAIR发表在ICCV 2019…

人工智能 2023年7月14日
0064
python实现新年倒计时代码

最近老想着过年和我的一个哥哥打游戏于是乎就敲了一个新年倒计时的代码出来大家用的时候可以更改上面的日期，以后年年都可以用话不多说，上代码代码： import datetime…

人工智能 2023年7月31日
0048
Pytorch中torch.cat()函数解析

一. torch.cat（）函数解析 1. 函数说明 1.1 官网：torch.cat()，函数定义及参数说明如下图所示：1.2 函数功能函数将两个张量（tensor）按指定维度拼…

人工智能 2023年7月20日
0059
从tensorflow_datasets读取的mnist数据集，如何初始化

人工智能 2023年5月26日
0098
图像去噪方法总结（最全，最详细），持续更新中……

图像降噪的英文名称是Image Denoising，图像处理中的专业术语。是指减少数字图像中噪声的过程，有时候又称为图像去噪。噪声是图像干扰的重要原因。一幅图像在实际应用中可能…

人工智能 2023年6月16日
0097
深度学习-在pycharm里面使用anaconda环境

1、首先在conda prompt中创建新的。 conda create –name 时不需要添加。如之后还需要再添加新的库进入，需在conda prompt中激…

人工智能 2023年6月16日
00104
新版TCGA的突变数据SNP下载和整理

关于 TCGAbiolinks包的学习前面一共介绍了5篇推文。今天继续学习如何使用 TCGAbiolinks 下载和整理MAF格式的突变数据。之前的TCGA的 MAF文件是可…

人工智能 2023年6月29日
00152
基于pynq的数字识别神经网络加速器设计

文章目录基于pynq的数字识别神经网络加速器设计 * 软件部分 – 1. 全连接神经网络： 2. 卷积神经网络搭建： 3. 文件格式转换：硬件部分 – …

人工智能 2023年5月23日
0081

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31