目标检测基础知识(1)–目标检测任务描述

本文是目标检测基础知识相关的第1次学习记录,主要包括目标检测的任务描述,目标检测的常用算法。

在目标检测工程中,主要的项目结构包括三层,分别是数据采集层、深度模型层、用户层,这三个层次的相关功能分别为:

目前常用的目标检测算法分成两大类:2-stage和1-stage。

目标检测不仅仅是分类这样简单的从一个图片输出一个结果,而且还需要输出图片中目标的具体位置信息。

目标检测的具体任务:

通过目标检测算法最终得出来的物体位置信息(x,y,w,h)有一个专业的名词,叫做 bounding box(bbox) 。两种类型的bounding box需要进行区分,分别如下:

物体位置的表示一般有两种方式:

  • (x,y,w,h):其中x、y表示物体的中心点的位置,w、h表示中心点举例物体两边的长和宽。
  • (xmin,ymin,xmax,ymax):表示物体的左上角和右下角的位置,其中xmin,ymin表示左上角的位置,xmax,ymax表示右下角的位置。

增加一段全连接层网络输出目标的4个位置,并进行相应的损失计算。FC1用于类别的输出,FC2用于这个物体具体位置数值的输出。假设有10个类别,输出的概率值分别为:[p1,p2,…p10],然后输出这一个对象的四个位置信息[x,y,w,h],同时也要知道网络需要输出什么内容,并且如何来衡量网络的损失值:

  • 对于分类的概率,使用 交叉熵损失
  • 对于位置信息的具体数值,可以使用 MSE均方误差损失(L2损失)
    目标检测基础知识(1)--目标检测任务描述

分类与定位:图片中只有一个物体需要检测;
目标检测:图片中有多个物体需要检测。

Original: https://blog.csdn.net/weixin_43981621/article/details/120127926
Author: 我这一次
Title: 目标检测基础知识(1)–目标检测任务描述

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/687660/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球