【多目标跟踪MOT学习笔记】字节跳动ByteTrack论文研究（一）：BYTE策略

2023年7月13日上午4:45 • 人工智能 • 阅读 73

文章目录

前言
一、是什么ByteTrack？
二、BYTE
*
1.BYTE method 概览
2. First Association（关联1）
3. Second Association（关联2）
4. Post-Processing（后处理）
–
- 4.1 T_re-remain
- 4.2 D_remain
总结

前言

最近在研究Tracking-by-Detection的目标跟踪策略，想优化SOT的跟踪性能，恰好搜到了字节的这篇文章，所以进行了研究，本文简略介绍论文中所提到的BYTE策略。

一、是什么ByteTrack？

什么…是快乐星球？（手动狗头）
ByteTrack是字节跳动与2021年10月份公开的一个全新的MOT算法，原论文是《ByteTrack: Multi-Object Tracking by Associating Every Detection Box》目前收录于arXiv，还未发表。
ByteTrak的MOTA和FPS都实现了较好的性能，要优于现有的大多数MOT算法。

【多目标跟踪MOT学习笔记】字节跳动ByteTrack论文研究（一）：BYTE策略

个人觉得，本文的核心就是BYTE，不过BYTE的策略真的是十分简单易懂，而且原论文中也只有一个伪代码作为参考，所以我对该策略进行了总结。

; 二、BYTE

1.BYTE method 概览

由于原论文里面只有几张图片和一个伪代码，我根据自己对原论文的BYTE算法理解绘制了BYTE的流程框图，如下图所示。

先前的MOT算法一般在完成当前帧的目标检测后只会保留置信度比较大的检测框用于进行目标跟踪，比如图中置信度为0.9和0.8的目标框。而在BYTE中，作者保留了所有的检测框（图中的所有四个黄色的检测框）并且通过阈值将它们分成了两份，先后与上一帧的检测框（绿框、红框和蓝框）进行关联。
在跟踪过程中，由于遮挡、运动模糊和尺度变换等因素，我们仅仅凭借高置信度的检测框无法完美地实现所有目标的MOT，比如上图中关联1的输出，原先红框的对象被遗漏了，而关联2则较好地解决了这个问题，利用低置信度的检测框，既完成了红框目标的匹配，也滤除了背景误检的框（置信度为0.1的黄框）。

; 2. First Association（关联1）

完成Object Detection以后，对检测框的拆分较为容易理解，下面详细介绍一下BYTE提出的association策略。
对于关联1，我们可以将其理解为目前MOT主流的跟踪策略。下面展示了可视化的关联思路。

假设上图表示的是当前帧的关联策略，那么该操作的输入分别是前一帧的所有跟踪框的信息的卡尔曼滤波预测结果和当前帧的检测网络检测得到的置信度高于阈值的检测框，即上图中的粉红色的框框取的部分。（为了方便画图，我将KF操作包括在了关联1里面）
后续操作便是经典的IoU匹配和匈牙利算法寻优，得到当前帧的跟踪结果。关联1结束以后，为得到匹配的跟踪框和检测框将保留（图中的D_remain和T_remain），用于后续操作。
作者还提出，BYTE的关联1操作具有灵活性并可用于其他MOT算法，比如用在DeepSort里，就可以将Re-ID特征提取结果加入到关联1中，如上图所示。

3. Second Association（关联2）

关联2的输入分别为第置信度的检测框（如下图红框所示），以及关联2的其中一个输出结果T_remain，其操作事实上仅仅只使用了IoU匹配，最后输出匹配上的跟踪框tracks T和仍然没有匹配上的检测框T_re-remain。

作者表示，对于低置信度的检测框，由于目标往往处于严重遮挡和严重运动模糊的状态，所以外观相似度特征（比如ReID）非常不可靠，而相比较而言IoU匹配是更佳的选择，鉴于此，在关联2中，作者仅仅只使用了IoU,而并未引入外观相似度。
对于关联1，我们可以将其理解为目前MOT主流的跟踪策略。下面展示了可视化的关联思路。

; 4. Post-Processing（后处理）

以上已经介绍了BYTE的主题思路，确实是简单易懂，但是还没完事，想必各位巨佬都已经注意到了我们还有两个数据没有处理，分别是关联1的输出D_remain和关联2的输出T_re-remain。这里作者给出了处理方案。

4.1 T_re-remain

事实上，对于长时的目标跟踪，我们对跟踪框的ID进行保存是很有必要的（比如目标10在第100帧消失后，又在第120帧重新出现），所以对于关联2操作以后未得到匹配的跟踪框T_re-remain（即消失的目标），作者将其放入了T_lost中。
T_lost中的跟踪框会在保留特定帧以后进行删除（比如30帧），而在这30帧里面，T_lost将仍然放到tracks T里面进行下一帧的跟踪预测，只是对于当前帧的跟踪结果，T_lost的boxes和ID并不会显示在图中（说白了就是表面上看不出来，实际上还是在使用这些未匹配上的框，如果这些框一直匹配不上就扔了，也不亏，要是重新匹配上了就血赚~）。

4.2 D_remain

关联1输出的D_remain直接用于生成新的跟踪框，表示有新目标出现。因为本身D_remain中的检测框都拥有较高的置信度，如果其中的目标框的置信度高于设定阈值且连续两帧都被检测到的话，就生成新的跟踪框。

总结

后续看一下ByteTrack算法，再试试能不能把官方例程跑通。其实是想把BYTE机制用到SOT里的，不过看官方源码上手的应该快一些~
官方源码传送门：https://github.com/ifzhang/ByteTrack

Original: https://blog.csdn.net/chl666888/article/details/123475954
Author: HaolinChen
Title: 【多目标跟踪MOT学习笔记】字节跳动ByteTrack论文研究（一）：BYTE策略

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/689104/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

在Python里使用ChatGPT

前言近来 chatGPT挺火的，也试玩了一下，确实挺有意思。这里记录一下在 Python中如何去使用 chatGPT。本篇文章的实现100%基于 chatGPT，我是搬运工无疑…

人工智能 2023年7月31日
0089
“multiprocessingspawn.py”, line 105, in spawn_main错误与解决方法

记录一个不知名的错误 * – + 错误 + 解决方法 OS： Windows 10错误非常的长，以至于，我也没有什么耐心去看，看了前面几行，应该是多线程引起的。下面太长…

人工智能 2023年7月23日
0072
记录解决cmd打不开/闪退

1.起因：事情要从万恶的环境配置说起。作为一个受anaconda折磨多次的资深bug maker（bushi），这次我又又又又又又又碰到问题了。由于一些深度学习包配置问题，我…

人工智能 2023年7月26日
0090
dbscan matlab 负荷曲线聚类_时间序列聚类-ROCKA算法

### 回答1： DBS_CAN（Density-Based Spatial Clustering of Applications with Noise）是一种基于密度的 _聚类 …

人工智能 2023年6月2日
0071
十五、非监督学习

\qquad监督学习和非监督学习的本质区别在于，数据集是否是带有”标签”的，当数据集是有标签的，则属于监督学习的范畴；当数据集没有标签，则属于非监督学习的范…

人工智能 2023年5月31日
0093
会自动化就能拿20K？不，你这顶多算会点皮毛···

前段时间公司要招2个自动化测试，同事面了几十个候选人，发现了一个很奇怪的现象，面试的时候，如果问的是框架api、脚本编写这些问题，基本上个个都能对答如流，等问到实际项目的时候，类…

人工智能 2023年7月31日
0085
Python基础之lambda表达式

1、lambda函数介绍 2、lambda函数与def函数的区别 3、lambda案例 4、map方法混搭有时在使用函数时不需要给函数分配一个名称，该函数就是”匿名函…

人工智能 2023年7月3日
0069
超图学习:聚类、分类和嵌入（实现超图谱聚类和节点嵌入）

原文：learning-with-hypergraphs-clustering-classification-and-embedding 摘要：贡献：超图表示超越双边关系的复杂关…

人工智能 2023年5月31日
00301
本文带你了解透彻云计算（前世，今生，未来）

作者简介：一名在校云计算网络运维学生、每天分享云计算运维的学习经验、和学习笔记。座右铭：低头赶路，敬事如仪 *个人主页：网络豆的主页前言对于云计算，我们将会通过云…

人工智能 2023年6月29日
00111
【AI with ML】第 1 章：TensorFlow 简介

🔎大家好，我是Sonhhxg_柒，希望你看完之后，能对你有所帮助，不足请指正！共同学习交流🔎📝个人主页－Sonhhxg_柒的博客_CSDN博客📃🎁欢迎各位→点赞👍 + 收藏⭐️ +…

人工智能 2023年7月30日
0065
Grapy Embedding–更多结构信息的图嵌入技术

一：Graph Embeding 出现的原因 word2vec 和其衍生的Item2vec做为一种embedding技术的基础性方法，都是建立在序列样本（词序列，用户行为序列）基础…

人工智能 2023年6月1日
00109
基于MMRotate训练自定义数据集做旋转目标检测 2022-3-30

本文目录简述 1.MMrotate下载 2.环境安装 3.自定义数据集制作 * 3.1 roLabelImg 打标签 3.2 生成DOTA数据集格式的标签 3.3 数据集裁剪（s…

人工智能 2023年5月26日
00100
最小二乘法的原理理解

在上文一文让你彻底搞懂最小二乘法（超详细推导）中我们提到过，发明最小二乘法的勒让德认为，让误差的平方和最小估计出来的模型是最接近真实情形的(误差=真实值-理论值)。换句话说，勒让…

人工智能 2023年6月12日
0087
如何进阶为年薪百万的数据分析师

如果你对数据分析感兴趣，希望学习更多的方法论，希望听听经验分享，欢迎移步微信公众号「小火龙说数据」，更多精彩原创文章与你分享！在之前的文章中，小火龙和大家分享了「如何入行数…

人工智能 2023年7月17日
0059
【python代码实现】人工神经网络分类算法及其实战案例（股票价格波动分析）

目录前置知识 * 1、前言 2、人工神经网络模型 – 2.1、神经元模型与单层神经网络 2.2、多层人工神经网络模型人工神经网络分类算法 * 1、构建数据集 2、响…

人工智能 2023年7月29日
0085
【AI】PyTorch实战（一）：目标检测之fasterrcnn_resnet50_fpn

1、简述 R-CNN系列演化史：R-CNN –> Fast RCNN –> Faster R-CNN 这篇博客只演示”怎么用&#82…

人工智能 2023年7月27日
0040

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31