我们提出了一种实时方法,用于从嘈杂数据对几何模型的多个实例进行稳健估计。几何模型,例如消失点,平面同型或基本矩阵对于3D场景分析至关重要。以前的方法以迭代方式发现了不同的模型实例,从而限制了它们通过并行计算加速的潜力 ...
0 0 138 2025/04/11 arXiv:2401.14919v1 dfjgds
随着卷积神经网络中最近的大规模发展,已经提出了许多基于CNN的轻量级图像超分辨率方法,用于在边缘设备上进行实际部署。但是,大多数现有方法都集中在一个特定方面:网络或损失设计,这导致难以最大程度地减少模型大小。为了解决这个问题,我们得出结论,设计,建筑搜索和损失设计,以获得更有效的SR结构 ...
0 0 0 2025/04/11 arXiv:2204.08759v2 cyps
高清 (HD) 地图为自动驾驶系统提供环境信息,对于安全规划至关重要。虽然现有的单帧输入方法在在线矢量化高清地图构建方面取得了令人印象深刻的性能,但它们仍然难以应对复杂的场景和遮挡。我们提出了 MemFusionMap,一种新颖的时间融合模型,具有增强的时间推理能力,用于在线高清地图构建 ...
0 0 0 2025/04/11 arXiv:2409.18737v2 13813931378
大型语言模型(LLM)越来越多地用于需要更长上下文长度的复杂任务,其中一些模型支持多达128K或1M Token 。但是,这种趋势在推理速度和内存管理方面提出了重大挑战。量化是一种有前途的方法,可以解决LLM大小和存储容量之间的差距的扩大 ...
0 0 0 2025/04/11 arXiv:2504.03661v2 muuuchen
多机构增强学习(MARL)在解决各种环境中解决合作和竞争性的多代理问题方面表现出重大进展。 MAL中的主要挑战之一是需要明确预测代理人的行为以实现合作。为了解决此问题,我们提出了共享的复发记忆 Transformer (SRMT),该记忆 Transformer (SRMT)通过汇总和全球广播单个工作记忆来扩展内存 Transformer 到多代理设置,使代理能够隐含地交换信息并协调其操作 ...
0 0 0 2025/04/11 arXiv:2501.13200v1 hwrabbit
当前的图像操作主要集中在静态操作上,例如更换图像中的特定区域或更改其整体样式。在本文中,我们介绍了一项创新的动态操纵任务,主题重新定位。此任务涉及将用户指定的主体重新定位为所需的位置,同时保留图像的保真度 ...
0 0 0 2025/04/11 arXiv:2401.16861v3 heuwangchao
持续学习(CL)的目的是在不灾难性忘记学习知识的情况下不断地从非平稳数据流中积累知识,需要在稳定性和适应性之间取得平衡。基于预训练模型(PTM)中的可推广表示,基于PTM的CL方法通过在冷冻的PTM上添加可学习的适配器或提示来对下游任务进行有效的持续适应。但是,许多现有的基于PTM的CL方法在固定的一组模块上使用受限制的适应性,以避免忘记CL能力有限 ...
0 0 0 2025/04/11 arXiv:2403.18886v3 19396386025
源代码摘要旨在生成代码段的自然语言描述。许多现有研究从其 Token 序列和抽象的语法树(ASTS)学习代码片段的句法和语义知识。他们使用学到的代码表示作为代码摘要模型的输入,可以相应地生成描述源代码的摘要 ...
0 0 0 2025/04/11 arXiv:2203.09707v2 15966829631

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)