目标检测踩坑指南

2023年5月31日上午10:13 • 人工智能 • 阅读 104

目标检测踩坑指南

事情是这样的。。。最近摸鱼时，，咳咳，，干活时踩了一点点坑。直入主题，在anchor_based的目标检测中，正确使用合适的anchor会给网络性能带来很大程度的提升。

读取到gt_boxes是否要经过变换？怎么变换？

一般在目标检测中，假设原始图像为(1280, 720)，而网络的输入为(640,640)，那么需要将图像resize。

当通过读取json文件，读取到图像的真实box时，boxes可能有两种存在方式，一种是(x1, y1, x2, y2)，其中（x1，y1）是box左上角的点在图像中的坐标，（x2, y2）是box右下角的点在图像中的坐标。另一种存在方式是：(cx, cy, w, h)，其中(cx, cy)是box的中心点在图像中的坐标，（w,h）是box的宽度和高度。
如果直接resize，长宽压缩比例有可能不同，例如：原始图像大小为(1280, 720)，而网络的输入/输出大小为(640, 640), 那么在width这一维度上，压缩比例为：640 / 1280 = 0.5，在height上这一维度上，压缩比例为：0.888。那么图像的gt_boxes的width维度上要按照0.5的比例压缩，height维度上以0.888的比例压缩。

如果获取anchor？

yolov3的anchor获取

注意anchor只是作为objects的宽高值的先验。所以在聚类的时候只需要这些objects的[width, height]就可以。

利用上述的方式获得所有的boxes的[width,height]之后，利用聚类算法获取9个anchor。有了这9个anchor，我们就可以认为：大部分的objects，其宽度和高度就在这个范围内。
一般的聚类算法，两个点的距离为欧氏距离。两个点的距离越近，两个点就有更大的可能为一个类。聚类算法的核心为：类间间距越大越好，类内间距越小越好。
在目标检测中，距离函数从欧式距离换成了1-iou(box1, box2). iou(box1, box2)代表两个box的交并比。
因为聚类元素为[width, height]. 并没有box。所以默认box的左上角值为(0,0)，宽高值即为box右下角的xy值，这样一个[width，height]也就对应一个box。
给定聚类数目，当聚类中心不再变化/达到一定聚类次数时，聚类结束。

yolov5的anchor获取

在yolov5中获取anchor的方式更加成熟，是利用k_means + 遗传变异的方法获取anchor。

anchor到底怎么用的啊？好烦哦。。

假如网络的输入为(640, 640)，网络输出层的三个featue map的大小分别为(20，20)，（40，40），（80，80）。假设我们的anchor为[[(w1, h1), (w2, h2), (w3, h3)], [(w4, h4), (w5, h5), (w6, h6)], [(w7,h7),(w8,h8),(w9,h9)]].

最小的网格需要使用最大的感受野，对应地，要使用最大的三个anchor，这三个anchor在应用时也要除以相同的尺度32。
最大的网格(80,80)需要使用较小的三个anchor，对应地，这三个anchor在应用时要处理相同的尺度8.

Original: https://blog.csdn.net/qq_38308028/article/details/122549884
Author: 不不加辣椒
Title: 目标检测踩坑指南

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/550500/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

4g工业路由器的功能有什么，跟家用路由器的区别是什么

4G工业路由器是一种物联网通讯联网设备，通过4G LTE蜂窝网络，为用户设备提供了快速联网的解决方案。通常4g工业路由器采用高性能嵌入式 CPU，工作频率高达 580MHz以上，基…

人工智能 2023年6月6日
0077
Pytorch 模型查看网络参数的梯度以及参数更新是否正确，优化器学习率设置固定的学习率，分层设置学习率

主要目标有的时候想看一下设置了优化器和学习率之后是否按照我设置的样子去进行更新，所以想查看一下网络参数中的及各相关变量：更新前的值优化器中的学习率计算出loss之后的梯度值…

人工智能 2023年7月21日
00221
OpenCV实战之人脸美颜美型（一）——开发环境搭建

### 回答1：人脸_识别系统是一种利用计算机技术对 _人脸_进行识别和验证的系统。其中， _opencv 人脸_检测是一种基于 _opencv_库的 _人脸_检测算法，可以通过…

人工智能 2023年7月20日
0043
【TabularData】DNN和表格数据分析建模综述

论文名称：Deep Neural Networks and Tabular Data: A Survey论文下载：https://arxiv.org/abs/2110.01889论…

人工智能 2023年7月15日
0048
第二十一天多米诺和托米诺平铺

多米诺和托米诺平铺问题描述：有两种形状的瓷砖：一种是 2 x 1 的多米诺形，另一种是形如 “L” 的托米诺形。两种形状都可以旋转。给定整数 n ，返回…

人工智能 2023年6月27日
0079
大数据常见组件zookeeper Kafka flume组件的常用操作命令

本文主要汇总了大数据常用组件zookeeper、kafka、flume的常用命令行操作 Zookeeper常用命令操作命令行语法 1）启动客户端 [atguigu@hadoop1…

人工智能 2023年6月4日
00101
TensorFlow2和keras详细安装教程

环境配置：系统：win10 1、安装 Anaconda，安装教程请自行百度。这里我使用的版本是： C:\Users\HaiBin>conda –version conda…

人工智能 2023年7月28日
0077
5分钟NLP：使用 HuggingFace 微调BERT 并使用 TensorBoard 可视化

上篇文章我们已经介绍了Hugging Face的主要类，在本文中将介绍如何使用Hugging Face进行BERT的微调进行评论的分类。其中包含：AutoTokenizer、Aut…

人工智能 2023年5月28日
0060
POL8901 LVDS转MIPI DSI 支持旋转图像处理芯片

### 回答1： LVDS_和 _MIPI_是两种不同类型的屏幕接口标准。 _LVDS（低压差分信号）是一种数据传输标准，广泛应用于消费电子产品中。它通过传输差分信号，在屏幕和处理…

人工智能 2023年6月22日
0064
自动驾驶单节点通信中间件探索

自动驾驶单节点通信中间件探索导读 01 背景 02 实验设计 03 实验结果摘要 * – 一：1对1场景。二：自动驾驶典型通信场景。三：端到端真实应用场景。 04…

人工智能 2023年6月2日
0091
为什么说学人工智能一定要学Python？

有很多人在问小千，为什么说学人工智能一定要学Python？运行速度慢不好之类的，今天就让小千谈谈自己对于Python的感受。一、先来说说Python的前景随着”大数…

人工智能 2023年7月17日
0059
动手学数据分析（2）–数据清洗及特征处理

import numpy as np import pandas as pd df=pd.read_csv(‘train.csv’) 查&#x770B…

人工智能 2023年7月18日
0044
ffmpeg 拼接mp4_ffmpeg添加字幕

ffmpeg添加字幕文件理论上这样就ok了，可以加src lrc ass等字幕文件但是，在实际应用中，以下代码会报告错误 [En] However, in practical …

人工智能 2023年5月27日
00106
目标检测、工业缺陷、图像分割—-深度学习数据集归纳

90+深度学习开源数据集整理｜包括目标检测、工业缺陷、图像分割等多个方向。推文给出了95种深度学习开源数据集。包括了11个方向（小目标检测、目标检测、工业检测、人脸识别、人体姿态估…

人工智能 2023年5月28日
0082
池化层在AI算法中的作用是什么

池化层在AI算法中的作用池化层是人工智能算法中常用的一种操作，主要用于减小数据尺寸并降低计算量，同时保留重要信息的同时减少冗余。在神经网络中，池化层通常用于卷积神经网络（CNN）…

人工智能 2024年1月4日
0029
pandas使用简介

Pandas是一个免费的Python库常用于数据分析。本库基于Python NumPy 库开发而来。其包含的数据结构有Series（一维数组结构）与 DataFrame（二维数组结…

人工智能 2023年7月17日
0062

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

目标检测踩坑指南

读取到gt_boxes是否要经过变换？怎么变换？

如果获取anchor？

yolov3的anchor获取

yolov5的anchor获取

anchor到底怎么用的啊？ 好烦哦。。

大家都在看

anchor到底怎么用的啊？好烦哦。。