介绍:现有的回归跟踪很少考虑部分对象之间的关系,导致在缺少目标对象的某些部分时发生飘逸。针对该问题,本团队首次将胶囊网络引入视觉目标跟踪任务,在解决胶囊网络高计算复杂度的同时有效利用胶囊网络构建部分-整体的关系,分别提出了基于胶囊的关系感知的回归跟踪、基于四叉树胶囊的深度回归跟踪、以及基于背景修复和胶囊网络的回归跟踪。所提出的跟踪方法均达到了当时最优的性能并超过了同期基于transformer的跟踪方法,并填补了将胶囊网络应用于目标跟踪任务的空白。此外,针对传统矩形框标注需要耗费大量的人力资源、易产生歧义、无法灵活切换目标等缺陷,本团队提出了多种基于自然语言查询的目标跟踪方法,包括基于胶囊和自然语言查询的回归跟踪和基于长短时上下文解耦和自然语言查询的目标跟踪。以上两种方法均实现了通过自然语言描述来指定和跟踪视频中的目标,极大地提升了目标跟踪的灵活性,也为人机交互、智能监控、自动驾驶等领域提供了更为智能、灵活的目标跟踪解决方案。

视觉目标跟踪
