DenseNet讲解（Tensorflow-2.6.0实现结构）

2023年5月23日下午4:33 • 人工智能 • 阅读 119

文章目录

*
– 1.论文地址
– 2.DenseNet结构
– 3.ResNet与DenseNet的对比
–
+ （1）ResNet（深度残差网络，Deep residual network）
+ （2）DenseNet
– 4.公式理解（传统CNN，ResNet,DenseNet）
– 5.网络结构讲解
–
+ （1）DenseNet的连接方式
+ （2）DenseBlock模块
+ （3）bottleneck层
+ （4）Transition层
– 6.实现结果对比
– 7.DenseNet的优缺点
–
+ （1）更强的梯度流动
+ （2）使用1×1的卷积减少了参数量
+ （3）保存了低维度的特征
+ （4）DenseNet的不足之处
– 8.Tensorflow实现网络结构

1.论文地址

https://arxiv.org/pdf/1608.06993.pdf

2.DenseNet结构

; 3.ResNet与DenseNet的对比

（1）ResNet（深度残差网络，Deep residual network）

通过建立前面层与后面层之间的”短路连接”，有助于训练过程中的梯度反向传播，防止梯度消失，从而可以训练更深的的网络。
关于ResNet结构讲解参考博文：
https://mydreamambitious.blog.csdn.net/article/details/124203294

（2）DenseNet

采用密集连接机制，也就当前层连接前面所有的层，每一层会与前面的所有层在channel维度上连接（concat）在一起，实现特征重用，作为下一层的输入。
注：DenseNet这样做不仅减缓了梯度消失的现象，也可以在参数与计算量更少的情况下实现比ResNet更好的性能。

4.公式理解（传统CNN，ResNet,DenseNet）

; 5.网络结构讲解

（1）DenseNet的连接方式

DenseNet的密集连接方式需要特征图大小保持一致，所以在DenseNet中使用了DenseBlock+Transition的结构。

（2）DenseBlock模块

DenseBlock是包含了很多层的模块，每一个层特征图大小相同，层与层之间采用密集连接方式：
A.在DenseBlock中，各个层的特征图大小一致，可以在channel维度上连接。DenseBlock中的非线性组合函数采用的是BN+ReLU+3×3 Conv的结构。

B.假定输入层的特征图的channel数为k0，DenseBlock中各个层卷积之后均输出k个特征图，即得到的特征图的channel数为k，那么l层输入的channel数为k0+(l−1)k, 我们将k称之为网络的增长率（growth rate）。

C.因为每一层都接受前面所有层的特征图，即特征传递方式是直接将前面所有层的特征concat后传到下一层，一般情况下使用较小的K（比如12），要注意这个K的实际含义就是这层新提取出的特征（特征图大小）。

D.Dense Block采用了激活函数在前、卷积层在后的顺序，即BN-ReLU-Conv的顺序，这种方式也被称为pre-activation。通常的模型relu等激活函数处于卷积conv、批归一化batchnorm之后，即Conv-BN-ReLU，也被称为post-activation。作者证明，如果采用post-activation设计，性能会变差。
如下图解：

; （3）bottleneck层

A. 由于后面层的输入会非常大，DenseBlock内部可以采用bottleneck层来减少计算量，主要是原有的结构中增加1×1 Conv，即
B. BN+ReLU+1×1 Conv+BN+ReLU+3×3 Conv
称为DenseNet-B结构。其中1×1 Conv得到4k个特征图它起到的作用是降低特征数量，从而提升计算效率。

每一个Bottleneck输出的特征通道数是相同的。
这里1×1卷积的作用是固定输出通道数，达到降维的作用，1×1卷积输出的通道数通常是GrowthRate的4倍。当几十个Bottleneck相连接时，concat后的通道数会增加到上千，如果不增加1×1的卷积来降维，后续3×3卷积所需的参数量会急剧增加。
比如，输入通道数64，增长率K=32，经过15个Bottleneck，通道数输出为64+15×32=544，
如果不使用1×1卷积，第16个Bottleneck层参数量是3x3x544x 32=156672，
如果使用1×1卷积，第16个Bottleneck层参数量是1x1x544x128+3x3x128x32=106496，可以看到参数量大大降低。

注：表示是在1×1卷积核使用filters为4xk个数。
DenseNet讲解（Tensorflow-2.6.0实现结构）

注：表示是在denseblock模块中的3×3卷积的卷积核个数使用当前block的输入filters个数。

（4）Transition层

A.它主要是连接两个相邻的DenseBlock，并且降低特征图大小。Transition层包括一个1×1的卷积和2×2的AvgPooling，结构为
BN+ReLU+1×1 Conv+2×2 AvgPooling.

B.Transition层可以起到压缩模型的作用。假定Transition的上接DenseBlock得到的特征图channels数为 m ,Transition层可以产生个特征（通过卷积层），其中是压缩系数（compression rate）。当Θ=1时，特征个数经过Transition层没有变化，即无压缩，而当压缩系数小于1时，这种结构称为DenseNet-C，一般使用Θ=0.5。对于使用bottleneck层的DenseBlock结构和压缩系数小于1的Transition组合结构称为DenseNet-BC。

; 6.实现结果对比

从图表中也可以看到，相比于ResNet，DenseNet不仅使用更少的参数量，而且效果还要比ResNet要好（DenseNet错误率比ResNet更低）。

从上面的两张图表可以看到ResNet和DenseNet的在相同错误的情况下参数量和FLOPS（浮点运算量）的对比，DenseNet的效果明显比ResNet的效果要好。
DenseNet讲解（Tensorflow-2.6.0实现结构）

在TOP-1和TOP-5错误率上，采用裁剪出10个图片进行验证，最后综合10张图片的结果比使用单张图片的效果都要好（相当于进行了数据增强）。

7.DenseNet的优缺点

（1）更强的梯度流动

由于密集连接方式，DenseNet提升了梯度的反向传播，使得网络更容易训练。由于每层可以直达最后的误差信号，实现了隐式的”deep supervision”。误差信号可以很容易地传播到较早的层，所以较早的层可以从最终分类层获得直接监管（监督）。
减轻了vanishing-gradient（梯度消失）过程中的梯度消失问题，在网络深度越深的时候越容易出现，原因就是输入信息和梯度信息在很多层之间传递导致的，而现在这种dense connection相当于每一层都直接连接input和loss，因此就可以减轻梯度消失现象，这样更深网络不是问题。

（2）使用1×1的卷积减少了参数量

关于1×1卷积的作用
https://mydreamambitious.blog.csdn.net/article/details/123027344

（3）保存了低维度的特征

对于在标准的卷积网络中而言，最终输出只会利用提取最高层次的特征；然而对于DenseNet，它使用了不同层次的特征，倾向于给出更平滑的决策边界。这也解释了为什么训练数据不足时DenseNet表现依旧良好。

（4）DenseNet的不足之处

在于由于需要进行多次Concatnate操作，数据需要被复制多次，显存容易增加得很快，需要一定的显存优化技术。另外，DenseNet是一种更为特殊的网络，ResNet则相对一般化一些，因此ResNet的应用范围更广泛。

参考视频： https://b23.tv/4NEe1wK

8.Tensorflow实现网络结构

import os
import keras
import numpy as np
import tensorflow as tf
from tensorflow.keras import layers
from tensorflow.keras.models import Model
from tensorflow.keras.preprocessing import image

#搭建DenseNetBlock模块
class DenseNetBlock(tf.keras.Model):
    def __init__(self,input_features,growth_rate):
        super(DenseNetBlock, self).__init__()
        #BN-ReLU-Conv
        self.batch1 = layers.BatchNormalization()
        self.relu1=layers.Activation('relu')
        self.conv1=layers.Conv2D(4*input_features,kernel_size=[1,1],strides=[1,1],padding='same')

        self.batch2=layers.BatchNormalization()
        self.relu2=layers.Activation('relu')
        self.conv2=layers.Conv2D(growth_rate,kernel_size=[3,3],strides=[1,1],padding='same')
    def call(self,inputs,training=None):
        x=self.batch1(inputs)
        x=self.relu1(x)
        x=self.conv1(x)

        x=self.batch2(x)
        x=self.relu2(x)
        x=self.conv2(x)

        x=tf.concat([
            x,inputs
        ],axis=3)

        return x

#搭建Transition 模块
class TransitionLayer(tf.keras.Model):
    def __init__(self,input_features):
        super(TransitionLayer, self).__init__()
        self.batch=layers.BatchNormalization()
        self.relu=layers.Activation('relu')
        self.conv=layers.Conv2D(input_features,kernel_size=[1,1],strides=[1,1],padding='same')
        self.avgpool=layers.AveragePooling2D(pool_size=[2,2],strides=[2,2],padding='same')
    def call(self,inputs,training=None):
        x=self.batch(inputs)
        x=self.relu(x)
        x=self.conv(x)
        x=self.avgpool(x)

        return x

#DenseNet
class DenseNet121(tf.keras.Model):
    def __init__(self,growth_rate,input_features,num_layers,num_classes):
        super(DenseNet121, self).__init__()
        self.growth_rate=growth_rate
        self.num_layers=num_layers
        #输入部分
        self.Inputs=keras.Sequential([
            layers.Conv2D(input_features, kernel_size=[7, 7], strides=[2, 2], padding='same'),
            layers.BatchNormalization(),
            layers.Activation('relu'),
            layers.MaxPool2D(pool_size=[3,3],strides=[2,2],padding='same')
        ],name='input')
        #We refer the DenseNet with θ <1 as DenseNet-C, and we set θ = 0.5
        self.densenetblock1=self.DenseNetBlocks(num_layers[0],input_features,0)
        input_features=input_features+num_layers[0]*self.growth_rate
        self.transition1=self.transitionlayer(input_features

        input_features=input_features
        self.densenetblock2 = self.DenseNetBlocks(num_layers[1], input_features,1)
        input_features = input_features + num_layers[1] * self.growth_rate
        self.transition2 = self.transitionlayer(input_features

        input_features = input_features
        self.densenetblock3 = self.DenseNetBlocks(num_layers[2], input_features,2)
        input_features = input_features + num_layers[2] * self.growth_rate
        self.transition3 = self.transitionlayer(input_features

        input_features = input_features
        self.densenetblock4 = self.DenseNetBlocks(num_layers[3], input_features,3)
        input_features = input_features + num_layers[3] * self.growth_rate

        #输出部分
        self.avgpool=layers.GlobalAveragePooling2D()
        self.dense=layers.Dense(num_classes)
        self.softmax=layers.Activation('softmax')

    def DenseNetBlocks(self,blocks,input_features,k):
        densenetblocks=keras.Sequential([],name='block'+str(k))
        for i in range(blocks):
            densenetblocks.add(
                DenseNetBlock(input_features+i*self.growth_rate,self.growth_rate)
            )
        return densenetblocks
    def transitionlayer(self,input_features,k):
        tranlayer=keras.Sequential([],name='tranlayer'+str(k))
        tranlayer.add(TransitionLayer(input_features))
        return tranlayer

    def call(self,inputs,training=None):
        x=self.Inputs(inputs)
        x=self.densenetblock1(x)
        x=self.transition1(x)

        x=self.densenetblock2(x)
        x=self.transition2(x)

        x=self.densenetblock3(x)
        x=self.transition3(x)

        x=self.densenetblock4(x)

        x=self.avgpool(x)
        x=self.dense(x)
        x=self.softmax(x)

        return x

model_denseNet=DenseNet121(growth_rate=32,input_features=64,num_layers=[6,12,24,16],num_classes=1000)
model_denseNet.build(input_shape=(None,224,224,3))
model_denseNet.summary()

if __name__ == '__main__':
    print('pycharm')

Original: https://blog.csdn.net/Keep_Trying_Go/article/details/124532139
Author: Keep_Trying_Go
Title: DenseNet讲解（Tensorflow-2.6.0实现结构）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/496468/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

关于opencv库的安装以及一些常见的问题

对opencv库的安装以及在使用中遇到的一些问题做一下总结，最大的一个问题就是安装好后，cv2下的自带的函数都显示不出来，也不能用。安装首先说一下安装，可以直接在Anacond…

人工智能 2023年7月19日
0037
《SVM支持向量机实现一个线性分类|CSDN创作打卡》

支持向量机在进行决策的时候，所选取的决策边界需要满足一个条件，也就是距离两个分类中最近点的距离是最长的。也可以理解为我们用支持向量机进行分类的时候，要做的就是将能够区分不同类别的数…

人工智能 2023年7月2日
0070
YOLOv5目标检测算法——通俗易懂的解析

目录 YOLOv5目标检测算法 * 前沿一.网络结构 1.1.Backbone 1.2.Neck 1.3.Head 二.数据增强 – 2.1.Mosaic 2.2.C…

人工智能 2023年6月17日
00105
【毕业设计】python+大数据校园卡数据分析

文章目录 0 前言 1 课题介绍 2 数据预处理 * 2.1 数据清洗 2.2 数据规约 3 模型建立和分析 * 3.1 不同专业、性别的学生与消费能力的关系 3.2 消费时间的特…

人工智能 2023年7月16日
0088
运行torchAudio下的wav2vec2.0样例

torchAudio在0.10.0版本中已经兼容了hubert的代码（现在已经0.11.0了）。然而，我连wav2vec2.0的代码都没跑过，官方文档也给出了一个wav2vec2….

人工智能 2023年5月27日
0088
基于知识图谱的对话系统

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月1日
0058
深度学习的显卡对比评测：2080ti vs 3090 vs A100

显卡大幅降价了但是还可以再等等，新的40系列显卡也要发售了，所以我们先看看目前上市的显卡的性能对比，这样也可以估算下40显卡的性能，在以后购买时作为参考。但是在本文之前一定要说下…

人工智能 2023年6月15日
00107
JupyterNotebook下添加pytorch和tensorflow

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年5月25日
0065
熵的推导与计算

一、信息熵熵 (entropy) 这一词最初来源于热力学。1948年，克劳德·爱尔伍德·香农将热力学中的熵引入信息论，所以也被称为香农熵 (Shannon entropy)， …

人工智能 2023年6月16日
0064
关于“Halcon许可错误（Hdevelop错误代码：21010）Halcon错误#2036”全网最全最有效解决方法

” Halcon许可错误（Hdevelop错误代码：21010）Halcon错误#2036″ ; 前言：针对”Halcon许可错误（Hdeve…

人工智能 2023年6月17日
00127
python实现 logistic 回归二分类算法（通俗讲解逻辑回归本质与由来）

logistic回归将数据样本看作是欧式空间的点，尝试找到一个超平面，将空间分成两部分，如果样本点在”正面”，则它被分为0类；如果样本点在”负…

人工智能 2023年6月16日
0074
机器学习课后练习题（期末复习题目附答案）

此为第五章支持向量机一. 单选题1. ‍对于在原空间中线性不可分问题,支持向量机()。A. 无法处理B. 在原空间中寻找线性函数划分数据C. 将数据映射到核空间中D. 在原空间中…

人工智能 2023年6月16日
00267
mulesoft 核心知识点 summary

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月26日
0074
pytorch 1.11.0 安装流程

文章目录前言一、CUDA 安装二、8.2.1 cudnn 三、安装 pytorch 测试前言我的是基于 pycharm + Anaconda 安装pytorch pyto…

人工智能 2023年6月17日
0076
Android compose wanandroid app之分类页面的实现

实现分类页面 * – 前言 – + Scaffold简单使用 + BottomNavigation和NavHost实现底部导航 + * BottomNavi…

人工智能 2023年7月2日
0064
啃书《利用python进行数据分析》第七章数据清洗与准备

啃书《利用python进行数据分析》第七章数据清洗与准备文章目录啃书《利用python进行数据分析》第七章数据清洗与准备 * 7.1处理缺失值 – 7.1.1过…

人工智能 2023年7月7日
0064

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30