人工智能——大白话熟悉目标检测基本流程

2023年7月26日上午7:43 • 人工智能 • 阅读 77

👦👦一个帅气的boy，你可以叫我Love And Program
🖱 ⌨个人主页：Love And Program的个人主页
💖💖如果对你有帮助的话希望三连💨💨支持一下博主

大白话熟悉目标检测基本流程

前言
数据集
数据加载类
主干网络（Backclone）
颈部网络
头部网络

前言

最近重拾目标检测，发现目标检测的基本流程都忘干净了，所以只能着手重新学习，下面来分享一下最近学习目标检测的一些基础知识，只有知道整个事件的基本流程才能加强对目标检测的理解，从而推进项目的进展。

数据集

在进行所有人工智能检测前我们必需准备的工作之一是获取数据集，目标检测算法根据流行的不同模型分为使用voc数据集（也就是xml数据集）、txt数据集、或是coco数据集（也就是json数据集），所以很多时候需要用代码将数据集转换成我们需要的格式。但是其进行下一步创建数据加载类时大都以一种形式将获取到的 边界框、类别、旋转角度等特征呈现使用，这里我不确定是不是都全转换成txt文件传入，但是最后形成的特征格式如下图，文件位置非必须）

简单来说就是不论是哪个数据集，放到数据加载类里都是一样的形式，所谓那些主流算法需要使用特定格式数据集只是人家就写了这一部分转换的代码而已，或许是因为团队不一样，公司不一样，所以不必在这一部分过于纠结。

YOLO算法使用txt文件读取，需要把voc格式转换成txt格式，或是更改yaml文件使用voc格式，具体内容请读者自行搜索。
Farst RCNN系列可以直接读取voc数据集。
MMDetection可以直接使用coco数据集。

; 数据加载类

整理好特征数据，接下来就是合理分配他们，但是这并不能像进行回归预测那样一股脑全部塞进去，受各方面影响， 需要分批次进行训练，也就是平时经常听到的bach size，将数据传输给主干网络。
同时在此对数据进行相应预处理，在上述划分数据集之前，我们可以进行数据增强，做个裁剪、加黑边、旋转、图像融合、Mosaic随即拼接都是可以的，在深入可以修改图像的一系列HSV参数，加入随机抖动等操作增加数据集数量。

主干网络（Backclone）

此时数据已经处理好了，接下来我们需要将处理好的数据传入主干网络，主干网络是目标检测任务的基本特征提取器，我们可以理解为进行了一次 相比颈部网络较为笼统地特征提取，最终传递所需n个输出特征层传入颈部网络。又因为适用场合不同，又分为 更深且连接密集的主干网络和轻量级网络，分别用于研究突破和用于工业、现场使用。
主干网络具体代码咱们就不讨论了，网上已经有很多实例了，本文主要是疏通一下目标检测的整体流程，可以分享一下主干网络主要用的思想就是大家 耳熟能详的那几种算法->VGG16/ResNet/CSPDarknet53/MobileNet系列等等。

颈部网络

主干网络产生的输出特征层传入颈部网络，颈部网络的作用是提取一些更复杂的特征，这一块就相对来说更加细节，相对流行的有FPN（特征金字塔），对特征进行多尺度融合；还有 SPP 模块，扩宽感受野，增强对特征图的提取能力，防止过拟合…

这一部分也是相当多的，但他们的本质都是 将特征进行进一步处理，使特征的相关性更加紧密，这样训练的模型鲁棒性更好，最后训练出实际应用的目标检测模型。如果将目标检测比作做一个精美的木雕的话，数据集就是原材料，主干网络就是雕一个大概原型，颈部网络就是细细雕刻每一个部位，最后的头部网络便是将对应目标木雕分销到各自需要的地方。

头部网络

通过前面网络训练的特征头部网络负责检测与定位，通过loss损失函数和非极大值抑制计算选取出最佳边界候选框位置，最后用mAP指标评价->通俗一点讲就是用来预测最后展示目标的类别和位置。

本文主要介绍目标检测的一个基本流程，仅供熟悉一些通用的操作，并没有过多的分析具体步骤，了解分析相应代码的时候应该先看哪一部分，不能盲目分析，只有找对基本步骤才能一步一步进行剖析拆解

如有错误，请及时指出，感谢支持，最后，咳咳，求赞求赞😍😍

Original: https://blog.csdn.net/qq_43604989/article/details/127705632
Author: Love And Program
Title: 人工智能——大白话熟悉目标检测基本流程

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/716527/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Self-Attention：初步理解

Self-Attention 的基本结构与计算 Attention（注意力）实际上就是权重的另一种应用的称呼，其具体结构与初始输入的 content (\vec{x_{1}}, \…

人工智能 2023年6月4日
0063
在Python3中使用opencv绘制圆形和矩形都不显示，怎么回事？

Original: https://blog.csdn.net/GoodStudy_Python/article/details/122138878Author: GoodStud…

人工智能 2023年6月22日
0084
Ubuntu20.04 使用Python实现全过程离线语音识别（包含语音唤醒，语音转文字，指令识别，文字转语音）

因为手头有项目，所以项目需要在橘子馅饼上实现语音控制，并具备语音唤醒功能。简单地说，就是通过唤醒词唤醒橘子派，然后说出相关指令，橙子就被送去执行指令。 [En] Because t…

人工智能 2023年5月27日
0074
python数据分析-互联网常见9种数据分析方法

一、对比分析什么是对比分析？对比分析就是将两个及以上数据进行比较，通过其中差异揭示业务发展趋势及问题。优点：简单、直观、量化的特点。缺点：不易得知问题的严重程度。对比原则：1…

人工智能 2023年7月16日
0079
python学习 pandas DataFrame 修改值 loc[] iat[] at[]

DataFrame中数据的修改应用当中，如果要修改DataFrame中的数据，同样也有很方便的操作方法，pandas提供了一系列的方法，可以按列、坐标位置、条件等去修改，下面…

人工智能 2023年7月8日
0054
辅助驾驶功能开发-功能规范篇(04)- 交通拥堵辅助及集成式巡航辅助TJA/ICA

1. 交通拥堵辅助及集成式巡航辅助功能概述 TJA/ICA在全速度范围内为驾驶员提供车辆的纵向和横向辅助。纵向辅助由ACC系统实现，将自身车辆维持在固定的车速或者与前方道路使用者…

人工智能 2023年6月10日
00116
NLP进阶，Bert+BiLSTM情感分析实战

Bert+BiLSTM做情感分析情感分析情感分析一类的任务比如商品评价正负面分析，敏感内容分析，用户感兴趣内容分析、甚至安全领域的异常访问日志分析等等实际上都可以用文本分类的方…

人工智能 2023年6月24日
0087
【Python自动化Excel】pandas处理Excel数据的基本流程

这里所说的 pandas 并不是大熊猫，而是Python的第三方库。这个库能干嘛呢？它在Python数据分析领域可是无人不知、无人不晓的。可以说是Python世界中的Excel。 …

人工智能 2023年7月8日
0078
RRT与RRT*算法具体步骤与程序详解（python）

提示：前面写了A*、Dijkstra算法文章目录前言一、RRT的原理与步骤二、RRT算法编写的步骤 * 1.算法步骤 2.算法的实现三、RRT*算法编写的步骤 * 1.算…

人工智能 2023年6月13日
0063
【Image Registration】图像配准综述

文章目录一、图像配准定义二、图像配准应用场景 * 2.1 医学图像领域 2.2 其他领域三、图像配准分类四、图像配准过程 * 4.1 特征检测（Feature detect…

人工智能 2023年6月20日
0093
KG-网安

论文解读 Review on the Application of Knowledge Graph in Cyber Security Assessment 知识图谱在网络安全评估…

人工智能 2023年6月1日
0087
Google Colab装载Google Drive（Google Colab中使用Google Drive）

文章目录为什么要在Google Colab中使用Google Drive 装载Google Drive 从Google Drive中下载文件写入文件到Google Drive …

人工智能 2023年6月25日
00105
批量语音转文字python

from pydub import AudioSegment from aip import AipSpeech #baidu-aip 百度AI库获取的参数构造读取语音文件函数 …

人工智能 2023年5月25日
0077
基于U-Net模型的视网膜血管分割

(1) 视网膜血管图像数据集DRIVE简介 DRIVE (Digital Retinal Images for Vessel Extraction)数据集是用于视网膜病变研究的数据…

人工智能 2023年7月28日
0082
基于YOLOV7的openpose人体姿态检测识别，FPS可以达到“较高”的效果

前不久yolov7（原yolov4团队）在yolov6（美团）开源不到两周的时间也更新了，如下图所示，yolov7效果比前面的版本确实牛逼，在精度相同的情况下，速度上面提升了一大截…

人工智能 2023年6月16日
00107
天池学习赛：保险反欺诈预测（附代码）

前言一、赛题介绍二、数据描述性统计 1.查看缺失值、重复值、统计目标变量比例 2.查看异常值 3.查看训练集与测试集数据分布 3.1 查看数值变量 3.2 查看部分分类变量 4…

人工智能 2023年6月12日
00117

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

人工智能——大白话熟悉目标检测基本流程

大白话熟悉目标检测基本流程

大家都在看