一译 —— 文档和论文翻译、对照阅读、讨论和社区

Is Contrastive Learning Necessary? A Study of Data Augmentation vs Contrastive Learning in Sequential Recommendation

（srs）（cl）来利用无监督信号来缓解srs中的数据稀疏问题。一般来说，基于，cl的srs首先通过使用数据增强策略来增强原始序列交互数据，并采用对比训练方案来强制来自相同原始交互数据的那些序列的表示相似... ...

0 0 0 2025/08/25 arXiv:2403.11136v1 xxc

TReMu: Towards Neuro-Symbolic Temporal Reasoning for LLM-Agents with Memory in Multi-Session Dialogues

多课程对话中的时间推理提出了一个重大挑战，这在以前的时间推理基准中一直没有研究。为了弥合这一差距，我们提出了一项新的评估任务，以在多课程对话中进行时间推理，并引入一种方法，通过增强Locomo的对话并创建多选择QAS来构建新的基准测试。此外，我们提出了Tremu，这是一个旨在在这种情况下增强LLM代理的时间推理能力的新框架 ...

0 0 0 2025/08/25 arXiv:2502.01630v1 sleep

Vision Language Models Can Parse Floor Plan Maps

视觉语言模型（VLM）可以同时推理图像和文本以解决许多任务，从视觉问题回答到图像字幕。本文着重于地图解析，这是一项新的任务，在VLM上下文中未能探索，对移动机器人特别有用。地图解析不仅需要了解标签，还需要理解地图的几何配置 ...

0 0 0 2025/08/25 arXiv:2409.12842v1 gavin218

Numerical models outperform AI weather forecasts of record-breaking extremes

基于人工智能（AI）的模型正在彻底改变天气预报，并在各种基准任务上超过了领先的数值天气预测系统。但是，它们推断并可靠地预测前所未有的极端事件的能力尚不清楚。在这里，我们表明，对于纪录的天气极端，数值模型高分辨率预测（HRES）来自欧洲中等天气预报中心的高分辨率预测（HRES）仍然一贯胜过最先进的AI模型图形广播，Graphcast Operations，Panguct Operations，Pan ...

0 0 0 2025/08/25 arXiv:2508.15724v1 swaydy

MolmoAct: Action Reasoning Models that can Reason in Space

推理对于有目的的行动至关重要，但是大多数机器人基础模型将感知和指示直接绘制为控制，从而限制了适应性，泛化和语义基础。我们介绍了动作推理模型（ARM），这是一种通过结构化的三阶段管道整合感知，计划和控制的机器人基础模型。我们的模型Molmoact将观测和指令编码为深度感知 Token ，将中层空间计划作为可编辑的轨迹痕迹生成中层空间计划，并预测精确的低级动作，实现可解释和可解释的行为 ...

0 0 0 2025/08/25 arXiv:2508.07917v3 odenkkk

Where to show Demos in Your Prompt: A Positional Bias of In-Context Learning

内部文化学习（ICL）是大语言模型（LLMS）的重要新兴能力，在提示中包括一些演示（emos），可以在推断过程中很少进行学习。但是，已经发现ICL的性能可以对演示的选择及其顺序敏感。本文首次研究了未开发的ICL的新位置偏置：我们观察到，当演示，系统提示和LLM输入中的用户消息的位置变化时，预测和准确性会大大漂移 ...

0 0 0 2025/08/25 arXiv:2507.22887v1 boydfd

AgentOrchestra: A Hierarchical Multi-Agent Framework for General-Purpose Task Solving

代理系统的最新进展表明，在解决通用和高度复杂的任务方面具有显着的能力。但是，大多数当前模型都缺乏协调专用代理的机制，并且有限地推广到新的或不同领域的能力。为此，我们介绍了AgentorChestra，这是一种用于通用任务解决的层次多代理框架，将高级计划与模块化代理协作集成在一起 ...

0 0 0 2025/08/25 arXiv:2506.12508v3 boydfd

Advances and Challenges in Conversational Recommender Systems: A Survey

推荐系统利用交互历史来估计用户偏好，已在广泛的行业应用中得到大量使用。然而，由于固有的缺陷，静态推荐模型很难很好地回答两个重要问题：a（a）用户到底喜欢什么？（b）用户为什么喜欢某个项目？缺点是静态模型学习用户偏好的方式造成的，即... ...

0 0 0 2025/08/25 arXiv:2101.09459v7 yang1young

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）