SSD学习笔记—2022年3月23日

2023年7月10日上午9:08 • 人工智能 • 阅读 69

SSD

SSD用的是一种one-stage模型 SSD采用的主干网络是VGG网络。 SSD直接采用卷积对不同的特征图来进行提取检测结果。对于形状为m x n x p 的特征图，只需要采用3X3XP这样比较小的卷积核得到检测值。

SD采用VGG16作为基础模型，然后在VGG16的基础上新增了卷积层来获得更多的特征图以用于检测。SSD的网络结构如下图所示。上面是SSD模型，下面是Yolo模型，可以明显看到SSD利用了多尺度的特征图做检测。模型的输入图片大小是300X300。

conv 表示卷积层。
VGG
MaxPool2d() 函数是用于最大池化
kernel_size是卷积核大小
stride是步长 2，长和高都会分别压缩一半
所以高和宽会被压缩。

padding 是对边缘部分的数据进行压缩
300 300 64 到 150 150 64
卷积不会改变图片的长和高
ReLU() 是激活函数

pool5 = nn.MaxPool2d(kernel_size=3, stride=1, padding=1)

nn.ReLU(inplace=True), conv7, nn.ReLU(inplace=True)

nn.MaxPool2d(kernel_size=2, stride=2, ceil_mode=True)]

其中ceil_mode 取值是true 和false。

卷积—-卷积—–最大池化

     &#x4EE3;&#x7801;&#x8FD0;&#x884C;&#x7ED3;&#x679C;&#x5982;&#x4E0B;&#xFF1A;

17 Conv2d(256, 512, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
18 ReLU(inplace=True)
19 Conv2d(512, 512, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
20 ReLU(inplace=True)
21 Conv2d(512, 512, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
22 ReLU(inplace=True)
23 MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)

以下是VGG代码

import torch.nn as nn
from torchvision.models.utils import load_state_dict_from_url
'''
该代码用于获得VGG主干特征提取网络的输出。
输入变量i代表的是输入图片的通道数，通常为3。

300, 300, 3 -> 300, 300, 64 -> 300, 300, 64 -> 150, 150, 64 -> 150, 150, 128 -> 150, 150, 128 -> 75, 75, 128 ->
75, 75, 256 -> 75, 75, 256 -> 75, 75, 256 -> 38, 38, 256 -> 38, 38, 512 -> 38, 38, 512 -> 38, 38, 512 -> 19, 19, 512 ->
19, 19, 512 -> 19, 19, 512 -> 19, 19, 512 -> 19, 19, 512 -> 19, 19, 1024 -> 19, 19, 1024

38, 38, 512的序号是22
19, 19, 1024的序号是34
'''

base = [64, 64, 'M', 128, 128, 'M', 256, 256, 256, 'C', 512, 512, 512, 'M',
            512, 512, 512]

def vgg(pretrained = False):
    layers = []
    in_channels = 3
    for v in base:
        if v == 'M':
            layers += [nn.MaxPool2d(kernel_size=2, stride=2)]
        elif v == 'C':
            layers += [nn.MaxPool2d(kernel_size=2, stride=2, ceil_mode=True)]
        else:
            conv2d = nn.Conv2d(in_channels, v, kernel_size=3, padding=1)
            layers += [conv2d, nn.ReLU(inplace=True)]
            in_channels = v

    pool5 = nn.MaxPool2d(kernel_size=3, stride=1, padding=1)

    conv6 = nn.Conv2d(512, 1024, kernel_size=3, padding=6, dilation=6)

    conv7 = nn.Conv2d(1024, 1024, kernel_size=1)
    layers += [pool5, conv6,
               nn.ReLU(inplace=True), conv7, nn.ReLU(inplace=True)]

    model = nn.ModuleList(layers)
    if pretrained:
        state_dict = load_state_dict_from_url("https://download.pytorch.org/models/vgg16-397923af.pth", model_dir="./model_data")
        state_dict = {k.replace('features.', '') : v for k, v in state_dict.items()}
        model.load_state_dict(state_dict, strict = False)
    return model

if __name__ == "__main__":
    net = vgg()
    for i, layer in enumerate(net):
        print(i, layer)

Original: https://blog.csdn.net/m0_51265528/article/details/123686220
Author: 一个努力学习的萌新加油哦
Title: SSD学习笔记—2022年3月23日

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/682491/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Python数据分析高薪实战第六天数据过滤与数据清洗

13 高级索引：过滤与查看表格中的局部数据上一节课中，我们学习了 pandas 中两个核心的数据结构：Series 和 DataFrame，之后还学习了 DataFrame 的常…

人工智能 2023年7月16日
0053
GPU版本PyTorch详细安装教程

目录一、安装显卡驱动 1、查看显卡驱动型号 2、下载显卡驱动 3、查看GPU状态二、安装Visual Studio 2019 三、安装CUDA 1、下载对应版本的CUDA 2、…

人工智能 2023年6月16日
0091
基于SpringBoot的协同过滤算法商品推荐系统

末尾获取源码开发语言：JavaJava开发工具：JDK1.8后端框架：SpringBoot前端：采用Vue和HTML技术开发数据库：MySQL5.7和Navicat管理工具结合服务…

人工智能 2023年6月29日
0056
Python数据分析中的数据预处理：数据标准化

【小白从小学Python、C、Java】【Python全国计算机等级考试】【Python数据分析考试必会题】 ● 标题与摘要 Python数据分析中的数据预处理：数据标准化 …

人工智能 2023年7月15日
0086
基于EasyDL搭建音频在线实时分类系统

文章目录 * – 搭建音频在线实时分类系统 – + 1. easydl 训练音频分类模型 + * 1.1 上传数据并训练音频分类模型 * 1.2 发布训练好…

人工智能 2023年6月30日
0074
我的研究生论文的小总结 (以多标签方向为例)

文章目录前言主要结构回顾 1.先写代码和搞伪代码 2.通过伪代码, 慢慢完成The proposed approach 3.随时更新的符号系统 4.完成实验部分 5.完成摘要 …

人工智能 2023年6月26日
0052
回归算法

回归算法细说回归算法概念 * 1.什么是回归算法 2.线性回归 3.公式推导常见回归算法目标函数回归算法案例附加扩展内容 * – 过拟合：简单来说就是训练的模…

人工智能 2023年6月18日
00102
一文掌握基于深度学习的自动驾驶小车开发（Pytorch实现，含完整数据和源码，树莓派+神经计算棒）

目录一 . 基本介绍二、模拟平台安装和基本使用三、基于OpenCV的自动驾驶控制 3.1基于HSV空间的特定颜色区域提取 3.2基于canny算子的边缘轮廓提取 3.3感兴趣…

人工智能 2023年6月23日
0085
各种卷积方式的最全讲解

文章目录一：卷积的定义二：标准卷积 * 1.1D卷积 – Ⅰ：一维Full卷积 Ⅱ：一维Same卷积 Ⅲ：一维Valid卷积 Ⅳ：三种一维卷积的相互关系 2.2D卷…

人工智能 2023年6月24日
0063
OpenCV人脸识别

OpenCV人脸识别与口罩检测下载文件人脸检测人脸检测的检测方法主要有两类:基于知识(根据眼睛,眉毛,嘴巴,鼻子等器官特征及相互几何位置关系来检测)和基于统计(将人脸看作一个…

人工智能 2023年6月18日
0067
推荐系统的数据流

动辄TB乃至PB级別的训练数据，让推荐系统的数据流必须和大数据处理与存储的基础设施紧密结合，才能完成推荐系统的高效训练和在线预估。大数据平台的发展经历了从批处理到流计算再到全面融…

人工智能 2023年6月29日
0073
no model named “compat“ ，Tensorflow 版本问题

查看我的版本： Module: tf.compat | TensorFlow Core v2.6.0 Compatibility functions.https://tensorf…

人工智能 2023年6月24日
0082
高分辨率遥感图像目标检测和场景分类研究进展

本文按照西北工业大学程塨老师的高分辨率遥感图像目标检测和场景分类研究进展汇报进行整理，需要的同学可借此了解遥感图像相关知识~ 高分辨率遥感图像目标检测和场景分类一、背景介绍 * …

人工智能 2023年6月30日
0083
一元线性回归推导

### 回答1： MATLAB是一种用于数学计算、数据分析、可视化和编程的高级技术计算软件。一元线性回归_是最为简单的一种 _回归_分析方法，该方法可以用来预测一个因变量与一个自…

人工智能 2023年6月17日
0065
OpenCV入门（十）——图像分割技术

目录 0x01 FloodFill分割 0x02 均值漂移MeanShift 0x03 图割Grabcut 0x04 奇异区域检测 0x05 肤色检测 0x01 FloodFill…

人工智能 2023年5月28日
0084
基于Transformer的NLP智能对话机器人26-27章

第 26 章：跨语言 Cross-linagual 预训练模型 XLM 架构内幕及完整源码实现 1 ，cross-lingual pretraining 背后的数学原理剖析 2 …

人工智能 2023年5月30日
0065

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

SSD学习笔记—2022年3月23日

SSD用的是一种one-stage模型 SSD采用的主干网络是VGG网络。 SSD直接采用卷积对不同的特征图来进行提取检测结果。对于形状为m x n x p 的特征图，只需要采用3X3XP这样比较小的卷积核得到检测值。

大家都在看