YOLOv5基础知识点——目标检测基本思想

2023年7月11日下午10:09 • 人工智能 • 阅读 50

You Only Look Once

YOLO 将特征图划分为S×S的格子（grid cells），每个格子负责对落入其中的目标进行检测，一次性预测所有各自所含目标的边界框、定位置信度、以及所有类别概率向量。

对图片进行缩放–>经过卷积网络–>非极大抑制 (18条消息) 非最大抑制（NMS）_Yao-Blog的博客-CSDN博客

基本思想

经过卷积网络在特征图上划分S×S的网格，通过网格的划分得到边界框（bounding box）和置信度得分（confidence）以及类别的概率图（class probability map），结合两者得到最终检测结果

从图像的特征图出发，得到物体检测出的属性（attributes），即边界框的坐标（box co-ordinates）、目标性得分（objectness score）、分类的得分。

B表示有多少个边界框的预测。

多尺度融合

尺度划分越细，有助于小目标的检测

【目标检测】FPN(Feature Pyramid Network) – 知乎 (zhihu.com)

锚框（Anchor）机制

是一种先验框，我们预先设定一些边界框大小

每个预测框的 类别置信度得分（class confidence score）计算如下：

class confidence score = box confidence score × conditional class probability

它测量分类和定位（目标对象所在的位置）的置信度。

Pr(Object）框内有物体–>1,否则0

—>以有物体为条件，是哪一种类别的概率

NMS(Non-Maximum Suppression)非极大抑制

可能会有多个格子检测到同样的物体，所以会有一些冗余的检测框，所以做一个后处理。

测试时没有GT框，只能比较多个预测框，比较相互之间的IoU,做NMS

(18条消息) 非最大抑制（NMS）_Yao-Blog的博客-CSDN博客

损失函数（Loss function）

损失函数包括：

classification loss，分类损失

localization loss，定位损失（预测边界框与GT之间的误差）

confidence loss，置信度损失（框的目标性，objectness of the box）

总的损失函数：

classification loss+ localization loss + confidence loss

最适合新手入门的【YOLOV5目标实战】教程！基于Pytorch搭建YOLOV5目标检测平台！环境部署+项目实战（深度学习/计算机视觉）_哔哩哔哩_bilibili

Original: https://blog.csdn.net/qq_50645064/article/details/125990129
Author: MUTA️
Title: YOLOv5基础知识点——目标检测基本思想

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/686385/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

PyTorch学习系列教程：构建一个深度学习模型需要哪几步？

导读继续PyTorch学习系列。前篇介绍了PyTorch中最为基础也最为核心的数据结构——Tensor，有了这些基本概念即可开始深度学习实践了。本篇围绕这一话题，本着提纲挈领删繁…

人工智能 2023年6月16日
0065
Firefly AIO-3399ProC开发板刷ubuntu系统安装rknntoolkit 1.6.0 + tensorflow 2.0 + pytorch 1.5.0

AIO-3399Pro刷ubuntu系统同时配置rknntoolkit 1.6.0 环境由于本人所做项目需要将轻量级的深度学习算法进行部署，故前些日子购买了核心板为RK3399的…

人工智能 2023年5月23日
00113
声音大小与振幅的关系_NB物理创新课堂｜第13期：声音的特性

教学目标 (一) 知识与技能 1、了解声音的特性； 2、知道乐音的音调跟发声体的振动频率有关，响度跟发声体的振幅有关； 3、不同发声体发出乐音的音色不同。 (二)教学重难点 1、重…

人工智能 2023年5月27日
0086
数学建模—-聚类分析

聚类分析概念聚类分析是根据给出数据中发现描述对象及关系的信息，对数据对象进行分组的过程。聚类是一种寻找数据之间内在结构的技术，聚类把全体数据实例组织成一些相似组，这些相似组被称…

人工智能 2023年5月31日
0094
误差反向传播算法中的梯度是如何计算的

问题描述误差反向传播算法是神经网络中常用的训练算法之一，它通过计算梯度来更新神经网络的权重。在该问题中，我们将详细解释误差反向传播算法中梯度的计算过程，并通过使用虚拟数据集展示完…

人工智能 2024年1月4日
0038
Zero-Shot跨语态抽取式文摘

前言抽取式摘要可谓是一项很常见的NLP任务，但是由于缺乏训练语料使得这项任务比较难进行train，可是我们知道英文的相关数据集其实很多，于是可以通过跨语态的技术来辅助目标语言的抽…

人工智能 2023年5月28日
0082
ubuntu 编译安装支持CUDA的OpenCV

ubuntu 编译安装opencv 支持cuda cuda和cudnn的安装相对简单这里就不过多解释。一、安装opencv依赖包 sudo apt-get update sudo…

人工智能 2023年5月28日
0054
2021哈工大机器学习期末

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月15日
0061
[nlp] 基于知识图谱的电影问答系统——3.页面及操作流程设计

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月1日
0056
解决pycharm安装深度学习pytorch的d2l包失败问题

解决pycharm安装深度学习pytorch的d2l包失败问题解决pycharm安装深度学习pytorch的d2l包失败问题 * 1、首先查看现在pycharm所在的环境 2、从…

人工智能 2023年7月21日
0067
净重新分类指数NRI的计算

本文首发于公众号：医学和生信笔记 ” 医学和生信笔记，专注R语言在临床医学中的使用，R语言数据分析和可视化。主要分享R语言做医学统计学、meta分析、网络药理学、临床…

人工智能 2023年6月30日
0095
pandas计算含缺失值中列平均值_详解Python数据分析–Pandas知识点

本文主要是总结学习pandas过程中用到的函数和方法, 在此记录, 防止遗忘重复值的处理利用drop_duplicates()函数删除数据表中重复多余的记录, 比如删除重复多余…

人工智能 2023年7月6日
0053
图像处理-图像滤波

文章目录 1、图像滤波 2、各滤波特点 * 2.1 均值滤波 2.2 高斯滤波 2.3中值滤波 3、案例分析 * 3.1 均值滤波 – 3.1.1 代码 3.1.2 b…

人工智能 2023年6月20日
00151
深挖ROC曲线（截断值计算） – 基于R语言

深挖ROC曲线（截断值计算） – 基于R语言前言混淆矩阵 * 1.通过混淆矩阵计算准确度为什么需要计算截断值重点部分：AUC计算和截断值定义 * 1.何为最佳截…

人工智能 2023年7月2日
0080
机器学习笔记 – 生成对抗网络 (GAN)概述和入门示例

一、生成对抗网络 (GAN) 1、原理简述生成对抗网络 (GAN) 是一类功能强大的神经网络，用于无监督学习。它是由 Ian J. Goodfellow 在 2014 年开发和引…

人工智能 2023年5月23日
0086
一文带你了解知识图谱融入预训练模型哪家强？九大模型集中放送

©原创作者 | 疯狂的Max 01 预训练模型与知识图谱 1.预训练模型近年来，随着语言模型的技术发展，其在NLP领域获得巨大的成功，业界SOTA的前沿模型也大多是Transfo…

人工智能 2023年6月1日
0071

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

YOLOv5基础知识点——目标检测基本思想

大家都在看