近日,来自 MIT 等机构研究者提出了 小智同学的相关知识也可以到网站具体了解一下,有专业的客服人员为您全面解读,相信会有一个好的合作!https://xzhi.cc/
TC,这是首个用于预测密集目标点热力图 ( )T MOT
架构。在相同训练策略和同等数据下,TC 在两个标准 MOT 数据集上 (MOT17 以及稠密的 MOT20)均超越了 SOTA
方法。
尽管如此,多目标跟踪 (MOT)仍表现出与 T 某种程度上的不兼容:即标准的目标框( )表示方法配合稀疏查询对于学习基于 T 的 MOT 任务不是一种比较的方案。
受近期基于锚点(-)MOT 方法的启发,来自 MIT 等机构的研究提出 TC,这是首个用于预测密集目标点热力图 ( )T MOT 架构。
具体而言,该研究提出利用像素级密集多尺度查询(
- - )配合 T
强大的全局表示能力,全局且充足地检测和跟踪目标中心( )。相同训练策略和同等数据下,TC
在两个标准 MOT 数据集上 (MOT17 以及稠密的 MOT20)均超越了 SOTA 方法。特别地,在 MOT20
上,用更少的训练数据,该研究甚至超越了基于锚点的 MOT 以前 SOTA 方法。另外,与从 DETR 到 MOT
的简单推广相比,验研究也证明了所提出的架构表现出明显的性能和架构势。
论文:210345
代码:XUTC
出发点
1
目标框(
)的表示方式,在极度稠密的场景下会带来具有歧义且高度重叠的目标位置表示。解决目标框的歧义,终极的方式是提供稠密的目标标记
(例如分割掩码, )。但是这种标记往往需要消耗大量的人力成本,而且在 MOT
任务上,尚没有此类可用的大规模数据集。近期,基于锚点的 MOT 方法大大地缓解目标框带来的歧义且表现出 SOTA 的性能,如例 1 所示。
例 1:在稠密数据集(MOT20)里,锚点能更好地表示目标的位置。
2
目前多目标跟踪(MOT)大多基于先检测后跟踪的方式。所以,准确却不遗漏的检测出目标是提高 MOT 性能的关键因素之一。DETR
利用单独于图像且随机初始化的稀疏查询( )来检测目标,这往往会带来漏检( )。