基于RGB事件的跟踪是一个新兴的研究课题,重点关注如何有效地集成异构多模态数据(同步曝光视频帧和异步脉冲事件流)。现有的工作通常采用基于 Transformer 的网络来处理这些模式,并通过多个数据集的输入级或特征级融合来实现不错的准确性。然而,由于使用自注意力机制,这些跟踪器需要大量的内存消耗和计算复杂性 ...
视觉转换器极大地推进了计算机视觉领域的发展,提供了强大的建模能力和全局感受野。然而,它们的高计算要求限制了它们在处理长序列中的适用性。为了解决这个问题,状态空间模型(SSM)在视觉任务中获得了突出的地位,因为它们提供了线性计算复杂性 ...