在过去的几年中,深度学习领域发生了几次革命,主要是生成对抗网络(GAN)的巨大影响。甘斯不仅在定义模型时提供了独特的架构,而且还产生了令人难以置信的结果,这些结果直接影响了社会。由于GAN带来的重大改进和新的研究领域,社区不断提出新的研究,这些研究几乎不可能跟上时代 ...
多模式大语言模型(MLLM)的快速发展对文档域产生了深远的影响,从而创造了广泛的应用程序场景。这一进展突出了需要全面的基准测试来评估这些模型在各种特定文档特定任务中的功能。但是,现有的基准通常无法找到特定的模型弱点或指导系统的改进 ...
预训练技术的进步促进了大型语言模型(LLM)的发展。这些模型通过手动设计的提示展示了强大的推理能力。在这项工作中,我们评估了当前最先进的 LLM (GPT-4) 在知识图 (KG) 上的会话推理能力 ...
路径规划是机器人和自主导航中的一个基本科学问题,需要导出从起点到目的地的有效路线,同时避开障碍物。像 A* 及其变体这样的传统算法能够确保路径有效性,但随着状态空间的增长,计算和内存效率会显着降低。相反,大型语言模型 (LLM) 通过上下文理解擅长进行更广泛的环境分析,提供对环境的全球洞察 ...
用户模拟器对于复制人类与对话系统的互动至关重要,支持协作培训和自动评估,特别是对于大型语言模型(LLMS)。但是,现有的模拟器通常仅依靠文本话语,缺少隐性用户特征,例如个性,说话风格和目标。相反,基于角色的方法缺乏普遍性,因为它们取决于著名个体或原型的预定义概况 ...
自动回归 Transformer 的最新进展已彻底改变了从语言处理到视觉产生的不同领域的生成建模,表现出了显着的功能。但是,将这些进步应用于3D生成提出了三个关键挑战:3D数据冲突的无序性质与顺序的下一步预测范式相互冲突,传统的向量量化方法在应用于3D网格时会导致实质性压缩损失,以及缺乏有效的缩放策略来实现较高的分辨率延展性预测。为了应对这些挑战,我们介绍了MAR-3D,该MAR-3D将金字塔变异 ...
几位研究人员已经解决了代码审查的自动化,目的是降低其成本。软件工程中深入学习的采用将自动化推向了新的界限,并通过模仿开发人员在生成任务中的技术,例如对代码更改的评论或通过修改代码来解决审阅者的评论。这些技术的性能通常是通过定量指标来评估的 ...
矩阵完成模型是推荐系统最常见的公式之一。最近的作品在以图表的形式引入了用户/项目之间的成对关系,并在这些图表上施加平滑度初步时,显示了这些技术的性能。但是,这样的技术并不能完全利用用户/项目图的本地平稳性结构,而要学习的参数数为线性w ...