大型语言模型(LLMS)通常很难使他们的回答与客观事实保持一致,从而导致事实幻觉问题,这可能很难在没有相关知识的情况下检测和误导用户。尽管已采用后培训技术来减轻问题,但现有方法通常会遭受不同能力的概括和权衡的差。在本文中,我们建议通过直接增强LLM精确利用其现有记忆的基本能力来解决它 - 从培训前数据中获得的知识 ...
0 0 0 2025/05/21 arXiv:2502.19127v1 lpfgss
推荐系统(RS)已成为在各种现实世界情景下进行信息过滤的关键工具。近年来,已经广泛探索了跨域建议(CDR),以便在其他领域的帮助下在目标域中提供更好的建议结果。 CDR技术已经迅速发展,但缺乏全面的调查总结了最近的作品 ...
0 0 0 2025/05/21 arXiv:2503.14110v1 ryaner
关系提取(RE)是自然语言处理中的一项基本任务,旨在识别文本中的目标实体之间的关系。尽管许多RE方法是为单个句子或文档设计的,但跨文档RE已出现以解决多个长文档之间的关系。鉴于跨文档中长文档的性质,由于预训练的语言模型的长度限制,提取文档嵌入是具有挑战性的 ...
0 0 0 2025/05/21 arXiv:2405.20649v1 DUNK_911
大型语言模型(LLMS)需要大量的计算和内存资源,从而构成部署挑战。量化感知培训(QAT)通过在保持性能的同时降低模型精度来解决这些挑战。但是,尚不清楚QAT的缩放行为,尤其是在4位精度(W4A4)时的缩放行为 ...
0 0 0 2025/05/21 arXiv:2505.14302v1 felixslu
大型审计模型在跨不同方式的推理和规划任务中表现出越来越好的性能,开放了将它们用于复杂的顺序决策问题的可能性。在本文中,我们研究了大型语言模型(LLM)在各种交互式领域中进行强化学习(RL)的功能。我们通过首先生成奖励模型来培训使用RL的代理商,通过直接生成动作来评估他们制定决策政策的能力 ...
0 0 0 2025/05/21 arXiv:2410.05656v1 plum
统一模型的图像理解和产生的最新进展令人印象深刻,但是大多数方法仍然限于以多种方式为条件的单模式生成。在本文中,我们提出了Mogao,这是一个统一的框架,通过因果方法来实现交织的多模式生成来推动这一范式。 Mogao整合了建筑设计中的一系列关键技术改进,包括深融合设计,双重视觉编码器,交织的旋转位置嵌入以及多模式的无分类器指导,可以利用它来利用两种自动性模型的文本生成模型和扩散模型的优势,以实现高素 ...
0 0 0 2025/05/21 arXiv:2505.05472v2 苟舜禹
语义3D映射可用于许多应用程序,例如机器人导航和虚拟交互。近年来,语义分割和几何3D映射取得了长足的进步。但是,将这两个任务结合起来,从图像中结合这两个任务,以准确和大规模的语义映射 ...
0 0 0 2025/05/21 arXiv:1707.07388v1 gld19990303
无人机已成为具有多种应用的普遍机器人平台,在体现人工智能(体现的AI)中显示出巨大的潜力。参考表达理解(REC)使无人机能够根据自然语言表达式找到对象,这是体现AI的关键能力。尽管在接地场景方面取得了进步,但空中视图带来了独特的挑战,包括不同的观点,遮挡和尺度变化 ...
0 0 0 2025/05/21 arXiv:2502.00392v2 liumingzhu

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)