基于扩散和流动模型的最新发展具有显着高级的文本到原告生成(TTA)。尽管达到了良好的综合质量和可控性,但当前的TTA系统仍然遭受缓慢的推理速度,这大大限制了其实际适用性。本文介绍了Meanaudio,这是一种针对快速和忠实的文本量身定制的基于卑鄙的基础模型 ...
辅助机器人系统中有希望的有效的人类机器人相互作用是基于凝视的控制。但是,当前基于凝视的辅助系统主要帮助用户进行基本的掌握操作,从而提供有限的支持。此外,有限的意图识别能力限制了辅助系统提供各种辅助功能的能力 ...
随着模型上下文协议(MCP)的快速开发,MCP服务器的数量已超过10,000。但是,现有的MCP基准仅限于单行服务器设置,只有几个工具,从而阻碍了对大型现实世界情景中代理能力的有效评估。为了解决这一限制,我们提出了Livemcpbench,这是第一个综合基准,该基准包括95个基于MCP生态系统的现实世界任务,旨在评估LLM代理在各种服务器跨不同服务器的大规模评估 ...
为了提高大语言模型(LLM)的数学水平,DeepMath团队发起了一项开源计划,旨在开发开放的数学LLM并系统地评估其数学创造力。本文代表了该倡议的最初贡献。尽管数学LLM的最新发展主要强调了推理技能,但基准对本科级数学任务的基础标准证明了这些模型的创造能力相对较少,而且评估数据集仍然很少 ...
自动编码器网络是无监督的方法,旨在通过同时学习编码器生成器图来结合生成和代表性属性。尽管经过广泛的研究,但尚未完全解决它们是否具有相同的gan生成力量或学习分离表示的问题。我们介绍了一个共同解决这些问题的自动编码器,我们称之为对抗性潜在自动编码器(ALAE) ...
在本文中,我们开发了基于深度强化学习的车辆到车辆(V2V)通信的分散资源分配机制,可以将其应用于单播和广播场景。根据分散的资源分配机制,自主代理商的V2V链接或车辆,其决定以找到最佳的子频段和功率级别,而无需或不需要等待全球信息。由于所提出的方法是分散的,因此仅造成有限的传输开销 ...
Modern e-commerce platforms strive to enhance customer experience by providing timely and contextually relevant recommendations.但是,向专注于杂货店购物的客户推荐一般商品(例如将牛奶与牛奶起泡配对)仍然是一个至关重要的挑战。本文介绍了一种交叉授粉(XP)框架,这是一种新颖 ...
通过从问题到答案的结构化解释来阐明推理过程至关重要,因为它可以显着增强提问(QA)系统的可解释性,可追溯性和可信赖性。但是,结构化的解释要求模型执行复杂的结构化推理,这构成了巨大的挑战。大多数现有的方法通过监督学习着重于单步推理,忽略了步骤之间的逻辑依赖性 ...