大型语言模型(LLMS)与信息忘记和长途对话中的信息遗忘和效率低下的斗争。为了解决这个问题,我们提出了一种无培训的及时工程方法,即国家更新的多转向对话策略。它利用“状态重建”和“历史提醒”机制来有效地管理对话历史 ...
0 0 0 2025/09/25 arXiv:2509.17766v1 vivovivo
在这项工作中,我们提出了SPARC,这是一种用于3D感知的新型稀疏融合 Transformer ,将多视图像语义与雷达和摄像机点特征集成在一起。雷达和相机方式的融合已成为自主驾驶系统的有效感知范式。尽管传统的方法利用了密集的鸟类视图(BEV)的架构进行深度估算,但通过以对象为中心的方法论,基于当代查询的 Transformer 在仅相机检测中表现出色 ...
0 0 0 2025/09/25 arXiv:2411.19860v2 johndon
文本到视频生成的最新进展,尤其是在自回归模型的情况下,已经使描绘了各个场景的高质量视频综合了。但是,扩展这些模型以产生长期的跨场景视频仍然是一个重大挑战。随着自回归解码期间上下文长度的增长,计算成本急剧上升,并且模型保持一致性并遵守不断发展的文本提示的能力会导致变质 ...
0 0 0 2025/09/25 arXiv:2505.17574v1 xiewende
对话人类互动(CHAI)最近推动了AI的主流采用。但是,Chai对设计师和研究人员构成了两个关键挑战:用户经常有模棱两可的目标和对AI功能的不完全理解,并且互动是短暂而短暂的,限制了与用户持续参与的机会。 AI代理可以通过提出上下文相关的提示,在早期设计测试期间为用户站立,并帮助用户更好地表达其目标,来帮助解决这些挑战 ...
0 0 0 2025/09/25 arXiv:2501.18002v1 waterfall666
在风险投资(VC)行业,由于财务数据有限且需要主观收入预测,预测初创企业的成功具有挑战性。以前基于时间序列分析或深度学习的方法往往存在不足,因为它们未能纳入关键的公司间关系,例如竞争和协作。针对这些问题,我们提出了一种使用 GraphRAG 增强时间序列模型的新方法 ...
0 0 0 2025/09/25 arXiv:2408.09420v5 yuchao95
准确的3D几何感知是广泛的空间AI系统的重要先决条件。尽管最先进的方法取决于大规模的培训数据,但从现场视频中获取一致和精确的3D注释仍然是一个关键挑战。在这项工作中,我们介绍了Vipe,这是一种方便而多功能的视频处理引擎,旨在弥合此差距 ...
0 1 0 2025/09/25 arXiv:2508.10934v1 zlheos
自动论文评分(AES)是英语作为外语(EFL)编写教育的有用工具,为学生和讲师提供了实时论文分数。但是,以前的AES模型接受了与EFL写作教育的实际情况无关的论文和分数培训,并且由于缺乏适当的数据集而通常提供单个整体得分。在本文中,我们释放连衣裙,这是一个大规模的标准数据集,用于基于48的基于标准的自动论文评分 ...
0 0 0 2025/09/25 arXiv:2402.16733v3 554
长期以来,格雷戈里亚旋律是由一些细分市场词汇构建的想法一直是Chant奖学金的一部分。这种所谓的“碳化性”理论受到了很多音乐学的批评,但是在颂歌旋律中已经观察到了某些旋律段的频繁再利用,并且可能存在的细分数量可以使某些未经发现的段落存在的选项存在,这些选择仍存在一些未被发现的部分,这些段落仍将尚未证明cent鼻的价值,并且可以表现出该阶级的阶级,并且可以表现出对裂片的阶级,并具有对perperpe ...
0 0 0 2025/09/25 arXiv:2507.00380v1 miketom

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)