通过将视觉跟踪任务分解为两个子问题作为像素类别的分类和此像素上对象边界框的回归,我们提出了一个新颖的完全卷积的暹罗网络,以每像素的方式端到端求解视觉跟踪。所提出的框架暹罗由两个简单的子网组成:一个用于特征提取的暹罗子网络和一个用于边界框预测的分类 - 回归子网。我们的框架将Resnet-50作为骨干 ...
0 0 0 2025/03/22 arXiv:1911.07241v2 HGG
小型视觉模型(SVLM)的出现标志着多模式AI的关键进步,从而有效地处理了资源约束环境中的视觉和文本数据。这项调查对SVLM开发进行了全面的探索,并介绍了基于 Transformer ,基于MAMBA和混合动力的体系结构的分类法 - 重点介绍了紧凑的设计和计算效率的创新。讨论了诸如知识蒸馏,轻巧的注意机制和模态融合的技术,以减少资源需求的高性能推动者 ...
0 0 0 2025/03/22 arXiv:2503.10665v1 zxx233
几个名称的实体识别(NER)系统旨在仅基于几个标记的示例来识别新颖的class命名实体。在本文中,我们提出了一种分解的元学习方法,该方法通过依次处理几个镜头检测和使用元学习的几个射击实体来解决几个问题的问题。特别是,我们将几个射击跨度检测作为一个序列标记问题,并通过引入模型 - 不合稳定元学习(MAML)算法来训练跨度检测器,以找到一个可以快速适应新实体类的良好模型参数初始化 ...
0 0 0 2025/03/22 arXiv:2204.05751v2 张小平
Lyapunov优化理论最近成为了一个有力的数学框架,用于通过将长期目标转换为一系列实时短期决策,同时确保系统稳定性,从而解决复杂的随机优化问题。该理论在基于无人驾驶汽车(UAV)的低空经济(LAE)网络方案中特别有价值,在那里它可以有效地解决动态网络条件,多个优化目标和稳定性要求的固有挑战。最近,生成人工智能(Genai)因其前所未有的能力生成多样化的数字内容而引起了极大的关注 ...
0 0 0 2025/03/22 arXiv:2501.15928v1 DrNeur
近年来,利用可见的(RGB)和热红外(IR)图像的对象检测引起了广泛的关注,并已广泛实现在各种领域。通过利用RGB和IR图像之间的互补属性,对象检测任务可以在从白天到夜间环境中在各种照明条件上实现可靠且可靠的对象定位。大多数现有的多模式对象检测方法将RGB和IR图像直接输入深度神经网络,从而导致次要检测性能 ...
0 0 0 2025/03/22 arXiv:2401.10731v6 WHB
无监督的图像异常检测(UAD)旨在学习正常样品的鲁棒和歧视性表示。尽管每个课程单独的解决方案赋予昂贵的计算和有限的通用性,但本文着重于为多个类建立统一的框架。在如此具有挑战性的环境下,具有持续延长表示假设的基于重新建设的网络总是遭受“相同的快捷方式”问题,在这种问题中,正常样本和异常样本都可以得到很好的恢复且难以区分 ...
0 0 0 2025/03/22 arXiv:2310.14228v1 lzx
我们介绍了空气学习,一种开源模拟器和健身房环境,以深入增强资源受限的空中机器人。配备了域随机化,空气学习将无人机代理暴露于各种具有挑战性的情况下。我们在三种不同的环境和深Q网络(DQN)和近端策略优化(PPO)培训师中使用点对点障碍物避免任务播种工具集 ...
0 0 1 2025/03/22 arXiv:1906.00421v5 xdd
语言模型经常由于对歧义的处理而误解了人类的意图,这是NLP研究中良好认可的限制。尽管在道德上清晰的场景对LLMS更为明显,但在道德上模棱两可的环境中遇到了更大的困难。在这项调查中,我们探讨了LLM校准,以表明在这种情况下人类和LLM判断的一致性很差 ...
0 0 0 2025/03/22 arXiv:2410.07826v1 zhanjanis

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)