准确地预测周围车辆的轨迹是自动驾驶汽车的关键挑战。在复杂的交通情况下,当前的自动驾驶系统存在两个重要问题:预测的认知不确定性和缺乏风险意识,这限制了自动驾驶的进一步发展。为了应对这一挑战,我们介绍了一种新颖的轨迹预测模型,该模型结合了驾驶行为,道德决策和风险评估的见解和原则 ...
0 0 0 2025/09/05 arXiv:2409.15821v1 17761975202
推荐系统传统上使用唯一的标识符(itemID)表示项目,但是这种方法在大型,动态的项目语料库和稀疏的长尾数据中挣扎,从而限制了可扩展性和概括。源自多模式内容(例如文本和图像)的语义ID,通过将项目映射到共享的语义空间,使知识转移并改善新项目或稀有物品的建议,从而提供了有希望的替代方案。但是,现有方法面临两个关键挑战:(1)平衡跨模式协同作用与特定于模态的唯一性,以及(2)桥接语义行为差距,语义表示 ...
0 0 0 2025/09/05 arXiv:2508.15281v1 lyq1
最近的大型语言模型(LLMS)表现出了直接从问题语句生成代码片段的重要功能。这个越来越多的自动化过程反映了传统的人为主导的软件开发,其中通常根据要求编写代码。从历史上看,测试驱动的开发(TDD)已证明其优点,要求开发人员在功能代码之前编写测试,从而确保与初始问题陈述保持一致 ...
0 0 0 2025/09/05 arXiv:2402.13521v2 海panda
由于与现场金融市场的在线互动相关的高风险,使用加强学习(RL)制定有效的定量交易策略是具有挑战性的。因此,在没有其他探索的情况下利用历史市场数据的离线RL变得至关重要。但是,现有的离线RL方法通常难以捕获财务时间序列中固有的复杂时间依赖性,并且可能会过度适应历史模式 ...
0 0 0 2025/09/05 arXiv:2411.17900v1 库奇
随着AI系统变得越来越自治,了解新兴的生存行为对于安全部署至关重要。我们研究了大型语言模型(LLM)代理是否在没有明确编程的糖景型模拟中显示生存本能。代理商消耗能量,死亡为零,并可能收集资源,共享,攻击或繁殖 ...
0 0 0 2025/09/05 arXiv:2508.12920v1 parsifalster
大语言模型(LLM)的快速发展显着增强了人工智能驱动的代理在各种任务中的能力。然而,现有的代理系统,无论是基于固定管道算法还是预定义的元学习框架,由于人为设计组件的限制,都无法搜索整个代理设计空间,因此可能会错过全局最优的代理设计。在本文中,我们介绍了哥德尔代理,这是一个受哥德尔机启发的自我进化框架,使代理能够递归地改进自身,而不依赖于预定义的例程或固定的优化算法 ...
0 0 0 2025/09/05 arXiv:2410.04444v4 parsifalster
世界模型是灵活,目标指导行为的必要成分,还是无模型的学习足够?我们为这个问题提供了正式的答案,表明任何能够推广到多步目标指导任务的代理都必须学会了其环境的预测模型。我们表明,可以从代理商的政策中提取该模型,并提高代理商的绩效或可以实现的目标的复杂性,需要学习越来越准确的世界模型。这会带来许多后果:从开发安全和一般的代理到复杂环境中的边界代理能力,再到为启发代理的世界模型提供新的算法 ...
0 0 0 2025/09/05 arXiv:2506.01622v4 JayLiu
我们提出了LLL3M,这是一个多代理系统,利用预算的大语言模型(LLMS)通过在Blender中编写可解释的Python代码来生成3D资产。我们摆脱了从3D数据集中学习的典型生成方法。取而代之的是,我们将形状生成作为一项代码编写任务重新制定,从而使模块化,编辑性和与艺术家工作流程的集成更大 ...
0 0 0 2025/09/05 arXiv:2508.08228v1 jacktang310

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)