机器人模仿学习依赖于4D多视图顺序图像。但是,数据收集的高成本和高质量数据的稀缺性严重限制了视觉策略(如视觉语言行动(VLA)模型)的概括和应用。数据增强是克服数据稀缺性的有力策略,但是目前缺乏编辑4D多视图顺序图像的方法 ...
多代理探路(MAPF)是一个问题,通常需要在共享环境中为多个代理找到无碰撞路径。即使在限制性的假设下,也最佳地解决MAPF是NP-顽强的,但对于此问题的有效解决方案对于众多应用程序(例如自动仓库和运输系统)至关重要。最近,基于学习的MAPF方法引起了人们的关注,尤其是那些利用深度强化学习的方法 ...
我们通过在主动推论中实施心理理论(TOM)来提出一种新颖的多代理合作方法。汤姆 - 理解他人可以拥有不同知识和目标的能力 - 使代理商在计划自己的行动时能够推论他人的信念。与以前的多代理合作推理方法不同,我们的方法既不依赖于特定于任务的共享生成模型,也不需要明确的通信,同时又可以概括 ...
大型语言模型(LLM)已从对话问题解决到解决涉及工具使用的现实世界任务,例如软件工程(SWE)。最近由LLM驱动的工具包(例如OpenAI Codex和Cursor)提供了软件开发过程的端到端自动化。但是,由于缺乏高质量的培训数据和有效的测试用例,建立有效的SWE代理仍然具有挑战性 ...
语言模型的最新发展为空中交通管制研究创造了新的机会。当前的重点主要是基于文本和基于语言的用例。但是,这些语言模型可能会在空中交通管制域中产生更高的潜在影响,这要归功于它们以体现的代理形式与空中交通环境进行交互的能力 ...
赞助搜索广告中的关键字决定对于广告活动的成功至关重要。尽管基于LLM的方法提供自动关键字生成,但它们面临三个主要局限性:依赖大规模查询键单词对数据,缺乏在线多目标性能监视和优化以及关键字选择中的质量较弱。这些问题通过监视和推理关键绩效指标(例如印象,点击,转换和CTA效力)来阻碍LLM在完全自动化关键字决策中的代理使用 ...
Clinically-Inspired Multi-Agent Transformers for Disease Trajectory Forecasting from Multimodal Data
深度神经网络通常应用于医学图像以自动化医学诊断问题。但是,从业人员通常面临的一个更临床相关的问题是如何预测疾病的未来轨迹。当前的预后或疾病轨迹预测的方法通常需要领域知识,并且适用 ...
我们可以模拟用生成代理模拟人类行为的沙盒社会,从而减少对人类实际试验评估公共政策的过度依赖?在这项工作中,我们调查了使用疫苗犹豫模拟与健康相关的决策的可行性,该疫苗被定义为尽管有疫苗接种服务的可用性(Macdonald,2015年),但作为案例研究的延迟或拒绝疫苗的延迟。为此,我们介绍了100个由大语言模型(LLM)提供动力的生成代理的VACSIM框架。 VACSIM通过以下步骤模拟疫苗政策结果: ...