卷积神经网络模型之——GoogLeNet网络结构与代码实现

2023年7月23日下午8:07 • 人工智能 • 阅读 81

文章目录

GoogLeNet网络简介
GoogLeNet网络结构
*
Inception之前的几层结构
Inception结构
–
Inception之后的几层结构
辅助分类模块
–
- 辅助分类模块1
- 辅助分类模块2
整体网络结构
*
pytorch搭建完整代码
结构图

GoogLeNet网络简介

GoogLeNet原文地址：Going Deeper with Convolutions：https://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Szegedy_Going_Deeper_With_2015_CVPR_paper.pdf

GoogLeNet在2014年由Christian Szegedy提出，它是一种全新的深度学习结构。

GoogLeNet网络的主要创新点在于：

提出Inception结构在多个尺寸上同时进行卷积再聚合；
使用1X1的卷积进行降维以及映射处理；
添加两个辅助分类器帮助训练；
辅助分类器是将中间某一层的输出用作分类,并按一个较小的权重加到最终分类结果中。
使用平均池化层代替全连接层，大大减少了参数量。

; GoogLeNet网络结构

GoogLeNet的完整网络结构如下所示：

下面我们将其逐层拆分讲解并结合代码分析

Inception之前的几层结构

在进入Inception结构之前，GoogLeNet网络先堆叠了两个卷积（实则3个，有一个1X1的卷积）和两个最大池化层。


self.front = nn.Sequential(
    nn.Conv2d(3, 64, kernel_size=7, stride=2, padding=3),
    nn.ReLU(inplace=True),

    nn.MaxPool2d(kernel_size=3,stride=2,ceil_mode=True),

    nn.Conv2d(64,64,kernel_size=1),
    nn.Conv2d(64,192,kernel_size=3,stride=1,padding=1),
    nn.ReLU(inplace=True),

    nn.MaxPool2d(kernel_size=3,stride=2,ceil_mode=True),
)

Inception结构

Inception模块只会改变特征图的通道数，而不会改变尺寸大小。

Inception结构相对复杂，我们重新创建一个类来构建此结构，并通过参数不同的参数来控制各层的通道数。

class Inception(nn.Module):
    '''
     in_channels: 输入通道数
     out1x1：分支1输出通道数
     in3x3：分支2的3x3卷积的输入通道数
     out3x3：分支2的3x3卷积的输出通道数
     in5x5：分支3的5x5卷积的输入通道数
     out5x5：分支3的5x5卷积的输出通道数
     pool_proj：分支4的最大池化层输出通道数
    '''
    def __init__(self,in_channels,out1x1,in3x3,out3x3,in5x5,out5x5,pool_proj):
        super(Inception, self).__init__()

        self.branch1 = nn.Sequential(
            nn.Conv2d(in_channels, out1x1, kernel_size=1),
            nn.ReLU(inplace=True)
        )
        self.branch2 = nn.Sequential(
            nn.Conv2d(in_channels,in3x3,kernel_size=1),
            nn.ReLU(inplace=True),
            nn.Conv2d(in3x3,out3x3,kernel_size=3,padding=1),
            nn.ReLU(inplace=True)
        )
        self.branch3 = nn.Sequential(
            nn.Conv2d(in_channels, in5x5, kernel_size=1),
            nn.ReLU(inplace=True),
            nn.Conv2d(in5x5, out5x5, kernel_size=5, padding=2),
            nn.ReLU(inplace=True)
        )

        self.branch4 = nn.Sequential(
            nn.MaxPool2d(kernel_size=3,stride=1,padding=1),
            nn.Conv2d(in_channels,pool_proj,kernel_size=1),
            nn.ReLU(inplace=True)
        )

    def forward(self,x):
        branch1 = self.branch1(x)
        branch2 = self.branch2(x)
        branch3 = self.branch3(x)
        branch4 = self.branch4(x)

        outputs = [branch1,branch2,branch3,branch4]
        return torch.cat(outputs,1)

Inception3a模块


self.inception3a = Inception(192, 64, 96, 128, 16, 32, 32)

Inception3b + MaxPool


self.inception3b = Inception(256, 128, 128, 192, 32, 96, 64)
self.maxpool3 = nn.MaxPool2d(3, stride=2, ceil_mode=True)

Inception4a


self.inception4a = Inception(480, 192, 96, 208, 16, 48, 64)

Inception4b


self.inception4b = Inception(512, 160, 112, 224, 24, 64, 64)

Inception4c


self.inception4c = Inception(512, 160, 112, 224, 24, 64, 64)

Inception4d


self.inception4d = Inception(512, 112, 144, 288, 32, 64, 64)

Inception4e+MaxPool


self.inception4e = Inception(528, 256, 160, 320, 32, 128, 128)
self.maxpool4 = nn.MaxPool2d(3, stride=2, ceil_mode=True)

Inception5a


self.inception5a = Inception(832, 256, 160, 320, 32, 128, 128)

Inception5b


self.inception5b = Inception(832, 384, 192, 384, 48, 128, 128)

Inception之后的几层结构

; 辅助分类模块

除了以上主干网络结构以外，GoogLeNet还提供了两个辅助分类模块，用于将中间某一层的输出用作分类，并按一个较小的权重(0.3)加到最终分类结果。

与Inception模块一样，我们也重新创建一个类来搭建辅助分类模块结构。

class AccClassify(nn.Module):

    def __init__(self,in_channels,num_classes):
        self.avgpool = nn.AvgPool2d(kernel_size=5, stride=3)
        self.conv = nn.MaxPool2d(in_channels, 128, kernel_size=1)
        self.relu = nn.ReLU(inplace=True)

        self.fc1 = nn.Linear(2048, 1024)
        self.fc2 = nn.Linear(1024, num_classes)

    def forward(self,x):
        x = self.avgpool(x)
        x = self.conv(x)
        x = self.relu(x)
        x = torch.flatten(x, 1)
        x = F.dropout(x, 0.5, training=self.training)
        x = F.relu(self.fc1(x), inplace=True)
        x = F.dropout(x, 0.5, training=self.training)
        x = self.fc2(x)

        return x

辅助分类模块1

第一个中间层输出位于Inception4a之后，将Inception4a的输出经过平均池化，1X1卷积和全连接后等到分类结果。

self.acc_classify1 = AccClassify(512,num_classes)

辅助分类模块2

self.acc_classify2 = AccClassify(528,num_classes)

整体网络结构

pytorch搭建完整代码

"""
#-*-coding:utf-8-*-
@author: wangyu a beginner programmer, striving to be the strongest.

@date: 2022/7/5 18:37
"""
import torch.nn as nn
import torch
import torch.nn.functional as F

class GoogLeNet(nn.Module):
    def __init__(self,num_classes=1000,aux_logits=True):
        super(GoogLeNet, self).__init__()
        self.aux_logits = aux_logits

        self.front = nn.Sequential(
            nn.Conv2d(3, 64, kernel_size=7, stride=2, padding=3),
            nn.ReLU(inplace=True),

            nn.MaxPool2d(kernel_size=3,stride=2,ceil_mode=True),

            nn.Conv2d(64,64,kernel_size=1),
            nn.Conv2d(64,192,kernel_size=3,stride=1,padding=1),
            nn.ReLU(inplace=True),

            nn.MaxPool2d(kernel_size=3,stride=2,ceil_mode=True),
        )

        self.inception3a = Inception(192, 64, 96, 128, 16, 32, 32)
        self.inception3b = Inception(256, 128, 128, 192, 32, 96, 64)
        self.maxpool3 = nn.MaxPool2d(3, stride=2, ceil_mode=True)

        self.inception4a = Inception(480, 192, 96, 208, 16, 48, 64)
        self.inception4b = Inception(512, 160, 112, 224, 24, 64, 64)
        self.inception4c = Inception(512, 128, 128, 256, 24, 64, 64)
        self.inception4d = Inception(512, 112, 144, 288, 32, 64, 64)
        self.inception4e = Inception(528, 256, 160, 320, 32, 128, 128)
        self.maxpool4 = nn.MaxPool2d(3, stride=2, ceil_mode=True)

        self.inception5a = Inception(832, 256, 160, 320, 32, 128, 128)
        self.inception5b = Inception(832, 384, 192, 384, 48, 128, 128)

        if self.training and self.aux_logits:
            self.acc_classify1 = AccClassify(512,num_classes)
            self.acc_classify2 = AccClassify(528,num_classes)

        self.avgpool = nn.AdaptiveAvgPool2d((1,1))
        self.dropout = nn.Dropout(0.4)
        self.fc = nn.Linear(1024,num_classes)

    def forward(self,x):

        x = self.front(x)

        x= self.inception3a(x)
        x = self.inception3b(x)
        x = self.maxpool3(x)

        x = self.inception4a(x)

        if self.training and self.aux_logits:
            classify1 = self.acc_classify1(x)

        x = self.inception4b(x)
        x = self.inception4c(x)
        x = self.inception4d(x)

        if self.training and self.aux_logits:
            classify2 = self.acc_classify2(x)

        x = self.inception4e(x)
        x = self.maxpool4(x)

        x = self.inception5a(x)
        x = self.inception5b(x)

        x = self.avgpool(x)
        x = torch.flatten(x,dims=1)
        x = self.dropout(x)
        x= self.fc(x)

        if self.training and self.aux_logits:
            return x,classify1,classify2

        return x

class Inception(nn.Module):
    '''
     in_channels: 输入通道数
     out1x1：分支1输出通道数
     in3x3：分支2的3x3卷积的输入通道数
     out3x3：分支2的3x3卷积的输出通道数
     in5x5：分支3的5x5卷积的输入通道数
     out5x5：分支3的5x5卷积的输出通道数
     pool_proj：分支4的最大池化层输出通道数
    '''
    def __init__(self,in_channels,out1x1,in3x3,out3x3,in5x5,out5x5,pool_proj):
        super(Inception, self).__init__()

        self.branch1 = nn.Sequential(
            nn.Conv2d(in_channels, out1x1, kernel_size=1),
            nn.ReLU(inplace=True)
        )
        self.branch2 = nn.Sequential(
            nn.Conv2d(in_channels,in3x3,kernel_size=1),
            nn.ReLU(inplace=True),
            nn.Conv2d(in3x3,out3x3,kernel_size=3,padding=1),
            nn.ReLU(inplace=True)
        )
        self.branch3 = nn.Sequential(
            nn.Conv2d(in_channels, in5x5, kernel_size=1),
            nn.ReLU(inplace=True),
            nn.Conv2d(in5x5, out5x5, kernel_size=5, padding=2),
            nn.ReLU(inplace=True)
        )

        self.branch4 = nn.Sequential(
            nn.MaxPool2d(kernel_size=3,stride=1,padding=1),
            nn.Conv2d(in_channels,pool_proj,kernel_size=1),
            nn.ReLU(inplace=True)
        )

    def forward(self,x):
        branch1 = self.branch1(x)
        branch2 = self.branch2(x)
        branch3 = self.branch3(x)
        branch4 = self.branch4(x)

        outputs = [branch1,branch2,branch3,branch4]
        return torch.cat(outputs,1)

class AccClassify(nn.Module):
    def __init__(self,in_channels,num_classes):
        self.avgpool = nn.AvgPool2d(kernel_size=5, stride=3)
        self.conv = nn.MaxPool2d(in_channels, 128, kernel_size=1)
        self.relu = nn.ReLU(inplace=True)

        self.fc1 = nn.Linear(2048, 1024)
        self.fc2 = nn.Linear(1024, num_classes)

    def forward(self,x):
        x = self.avgpool(x)
        x = self.conv(x)
        x = self.relu(x)
        x = torch.flatten(x, 1)
        x = F.dropout(x, 0.5, training=self.training)
        x = F.relu(self.fc1(x), inplace=True)
        x = F.dropout(x, 0.5, training=self.training)
        x = self.fc2(x)

        return x

结构图

Original: https://blog.csdn.net/weixin_43598687/article/details/125626247
Author: 1+1=王
Title: 卷积神经网络模型之——GoogLeNet网络结构与代码实现

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/711245/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

用深度学习完成3D渲染任务的蹿红

大纲用深度学习完成3D渲染任务的蹿红 * 研究背景和研究意义基于传统多视图几何的三维重建算法 – 相机标定以及坐标转换主动式——结构光法主动式——TOF激光飞行…

人工智能 2023年5月28日
0054
02 如何判断你的“创新”是否可以水一篇论文

我用 16 头，然后性能好了，我能发篇论文吗？ bs，32，64 一定不行如果你是第一个，大概率可以，（水一篇水刊水文）然后就编故事：这个领域有了什么问题，然后我用 bert …

人工智能 2023年6月4日
0079
解决CUDA error: no kernel image is available for execution on the device

1. 电脑配置 GPU 3080 算力8.6CUDA 11.1CUDNN 8.2.0conda 4.9.2python 3.8.5 2. 问题描述首先在pytroch官网根据电脑…

人工智能 2023年6月17日
0088
【课程作业】西瓜书机器学习课后习题：第七章

目录简介说明 7.1 7.3 7.4 结语 ; 简介 Hello！非常感谢您阅读海轰的文章，倘若文中有错误的地方，欢迎您指出～ ଘ(੭ˊᵕˋ)੭昵称：海轰标签：程序猿｜C++选…

人工智能 2023年7月27日
0084
保姆级讲解生成对抗网络GAN，及原始GAN的torch复现

保姆级讲解生成对抗网络GAN：保姆级讲解生成对抗网络 GAN 公众号目录综述： https://wangguisen.blog.csdn.net/article/details…

人工智能 2023年6月28日
0072
逻辑回归模型详解(Logistic Regression)

目录广义线性模型极大似然法逻辑回归的假设函数逻辑回归的损失函数交叉熵损失函数为什么LR模型损失函数使用交叉熵不用均方差交叉熵损失函数的数学原理交叉熵损失函数的直观理…

人工智能 2023年6月18日
00124
Additive Angular Margin Loss (ArcFace) 附加角裕度损失的进阶之路

ArcFace: Additive Angular Margin Loss for Deep Face Recognition 本文目的是梳理loss函数由欧式空间（Euclide…

人工智能 2023年7月1日
00103
Golang实现Windows的TTS实现文本转语音

文章目录 * – + TTS那些事 + 文本转语音 + 总结 TTS那些事 TTS语音合成技术是实现人机语音通信关键技术之一。使电脑具有类似于人一样的说话能力，是当今时…

人工智能 2023年5月27日
0073
机器学习笔记 – 什么是图神经网络？

一、图神经网络GNN概述机器学习的力量正在被用来解决一系列不同领域中日益复杂的问题。模型需要识别和理解更抽象的概念和对象，并且在许多情况下做出非线性决策。尽管它们本身很强大，但更…

人工智能 2023年7月13日
0067
error: (-215:Assertion failed) !_img.empty() in function ‘cv::imwrite‘已解决

项目场景： cv2保存图片报错 error: (-215:Assertion failed) !_img.empty() in function ‘cv::imwrite’ &am…

人工智能 2023年6月18日
0088
使用opencv分割图像（python实现）

使用opencv分割图像（python实现）概述本人在做无人农机的时候需要进行图像处理，寻找目标物并进行分割，于是总结网络各种小车寻迹等等demo，自己也终于把图像颜色分割做的…

人工智能 2023年6月18日
00103
python–matplotlib-绘制折线图

matplotlib 一、matplotlib–数据可视化图表二、绘制折线图 * – 1.设置图片大小： 2. 保存图片： 3.设置x、y轴的刻度 4.设置坐标中文字…

人工智能 2023年6月19日
0055
手机问题——语音让小爱同学学习用户对手机的操作并复现

文章目录 * – 问题 – 那么我们能否让小爱同学控制手机屏幕，完成我们事先录制的操作呢？ – 日常有语音转文字，实时中英翻译，以及用语音控制屏…

人工智能 2023年5月25日
0082
语音信号特性分析

语音信号时域和频域分析本次实验通过语音信号在时域的短时平稳性和短时过零率以及在频域的傅里叶分析，对不同的语音信号——清音【s】、浊音【wo】、爆破音【b】——进行了语音信号的时域…

人工智能 2023年5月25日
0092
java计算机毕业设计昆明市人民医院血库管理系统源代码+数据库+系统+lw文档

本源码技术栈：项目架构：B/S架构开发语言：Java语言开发软件：idea eclipse 前端技术：Layui、HTML、CSS、JS、JQuery等技术后端技术：JAV…

人工智能 2023年6月26日
0083
数据挖掘-KNN算法+sklearn代码实现(六)

🤵‍♂️ 个人主页：@Lingxw_w的个人主页✍🏻作者简介：计算机科学与技术研究生在读🐋 希望大家多多支持，我们一起进步！😄如果文章对你有帮助的话，欢迎评论 💬点赞👍🏻 收藏 📂…

人工智能 2023年6月12日
0071

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31