目标检测基础知识（1）–目标检测任务描述

2023年7月12日下午12:31 • 人工智能 • 阅读 88

本文是目标检测基础知识相关的第1次学习记录，主要包括目标检测的任务描述，目标检测的常用算法。

在目标检测工程中，主要的项目结构包括三层，分别是数据采集层、深度模型层、用户层，这三个层次的相关功能分别为：

目前常用的目标检测算法分成两大类：2-stage和1-stage。

目标检测不仅仅是分类这样简单的从一个图片输出一个结果，而且还需要输出图片中目标的具体位置信息。

目标检测的具体任务：

通过目标检测算法最终得出来的物体位置信息(x,y,w,h)有一个专业的名词，叫做 bounding box(bbox) 。两种类型的bounding box需要进行区分，分别如下：

物体位置的表示一般有两种方式：

（x,y,w,h）：其中x、y表示物体的中心点的位置，w、h表示中心点举例物体两边的长和宽。
（xmin,ymin,xmax,ymax）：表示物体的左上角和右下角的位置，其中xmin,ymin表示左上角的位置，xmax,ymax表示右下角的位置。

增加一段全连接层网络输出目标的4个位置，并进行相应的损失计算。FC1用于类别的输出，FC2用于这个物体具体位置数值的输出。假设有10个类别，输出的概率值分别为：[p1,p2,…p10]，然后输出这一个对象的四个位置信息[x,y,w,h]，同时也要知道网络需要输出什么内容，并且如何来衡量网络的损失值：

对于分类的概率，使用 交叉熵损失；
对于位置信息的具体数值，可以使用 MSE均方误差损失（L2损失）。

分类与定位：图片中只有一个物体需要检测；
目标检测：图片中有多个物体需要检测。

Original: https://blog.csdn.net/weixin_43981621/article/details/120127926
Author: 我这一次
Title: 目标检测基础知识（1）–目标检测任务描述

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/687660/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

声音分类及其实战（一）

目录前言音频简介 * WAV是什么？采样率、位深声音处理以及可视化 ; 前言玩过CV的都知道猫狗识别，通过输入一张猫狗图片之后经过神经网络就能知道这张图片属于猫还是狗，图…

人工智能 2023年5月25日
00156
机器学习——逻辑回归算法

一、分类问题（Classification ）在分类问题中，当要预测的变量 𝑦 是离散的值，我们将学习一种叫做逻辑回归 (Logistic Regression) 的算法，这是目…

人工智能 2023年6月18日
00103
【自动驾驶】华为车BU介绍（2021-11-23晚直播记录）

文章目录 * – 一、个人调研 – 二、关键PPT介绍 – 三、部分部门宣传页介绍 – + 3.1、智能座舱产品部 + 3.2、MD…

人工智能 2023年6月2日
0082
【免费通配符 SSL证书 (支持 IP) 申请教程】

分享几个具备免费通配符的网站OHTTPS：https://ohttps.com/Let’s Encrypt：https://letsencrypt.org/zh-cn/…

人工智能 2023年6月29日
0086
打造电商语音场景下的多轮人机交互

打造电商语音场景下的多轮人机交互 1. 语音人机交互在电商场景下的应用当前正处技术和市场拐点，行业发展将进一步提速。大幅提升品牌私域触达转化率，落粉率达16%，远超行业平均。AI语…

人工智能 2023年5月25日
0071
Java学习（Day 28）

学习来源：日撸 Java 三百行（51-60天，kNN 与 NB）_闵帆的博客-CSDN博客文章目录 kMeans 聚类 * 一、聚类二、kMeans步骤三、代码分析 &#8…

人工智能 2023年6月3日
00104
混检阳性概率的计算（贝叶斯定理的一个应用例）

目录 1. 混检阳性概率的计算 2. 混管阳性时你阳性的概率有多大？ 2.1 贝叶斯分析结果的解释混检阳性概率的计算目前核酸混检的基本做法是十混一，如果阳性人群分布完全随机，那…

人工智能 2023年7月29日
0059
MySQL：数据类型和表的约束

1. 数据类型学习语言的时候首先就是学习数据类型，数据类型起着为变量合理分配空间的作用。数据库同样需要合理使用空间，其次还可以约束SQL语句的正确性，所以同样需要数据类型。 1….

人工智能 2023年7月30日
0072
R语言使用cor函数计算相关性矩阵进行相关性分析，使用corrgram包的corrgram函数可视化相关性矩阵、行和列使用主成分分析重新排序、以将具有相似相关模式的变量聚类在一起

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年7月17日
0069
初学PCL（四）：ICP算法代码实现

算法输入：两个点集，source和target 算法输出：旋转矩阵R，平移矩阵T 算法步骤： 1、采集点集src属于source(均匀、随即、法失) （不一定必须要） 2、对于sr…

人工智能 2023年5月28日
00110
[数据压缩作业1]利用Audacity分析浊音、清音、爆破音|RGB文件三通道分量的熵计算

一. 利用Audacity分析浊音、清音、爆破音 1. 音频分析工具本次实验使用软件Audacity 2. 分析时域波形和频谱（1）浊音以a为例时域波形频谱结论：浊音时…

人工智能 2023年6月21日
0087
【PyTorch】torch.utils.data.Dataset 介绍与实战

训练模型一般都是先处理数据的输入问题和预处理问题。Pytorch提供了几个有用的工具：torch.utils.data.Dataset 类和 torch.utils.dat…

人工智能 2023年6月13日
0065
opencv 仿射变换

文章目录一、仿射变换二、求解仿射变换三、opencv 函数支持 * 1.getAffineTransform()函数 2.getRotationMatrix2D()函数 3….

人工智能 2023年5月26日
0079
ROS保存RBGD的深度图像、RGB图像

前言想要采集一些深度图和RGB图像，且两者是一一对应的，即一张深度图对应一张RGB图像，于是就有了以下的程序。相关准备我用的深度摄像头是奥比中光的摄像头，Ubuntu16的好…

人工智能 2023年5月28日
0062
将时间序列转化为监督学习问题

这里提供两种不同的数据划分方式，看喜好选择了鸭 pandas的shift()函数 import pandas as pd df = pd.DataFrame() df["…

人工智能 2023年7月6日
0072
python 广义似然比_回归五式第二式：0-1回归——上市公司ST状态预测和分析（内含报告和Python代码）…

0 目录 1.简单分析报告 2.具体操作（1）数据读取和处理（2）描述性分析（3）参数估计（4）模型选择（5）预测和评估 3.Python代码和数据集链接 4.参考文献 …

人工智能 2023年6月18日
0047

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

目标检测基础知识（1）–目标检测任务描述

大家都在看