本文探讨了扩展输入长度对大型语言模型 (LLM) 功能的影响。尽管 LLM 近年来取得了进步,但它们在不同输入长度上的性能一致性尚不清楚。我们通过引入一种新颖的 QA 推理框架来研究这个方面,该框架专门用于评估输入长度的影响 ...
大型语言模型 (LLM) 在广泛的任务中取得了显着的成功。由于 LLM 令人印象深刻的规划和推理能力,他们已被用作自主代理来自动完成许多任务。最近,在使用一个LLM作为单一规划或决策代理的发展基础上,基于LLM的多代理系统在复杂问题解决和世界模拟方面取得了长足的进步 ...
栖息在移动平台上是增强四旋翼飞行器的续航能力和操作范围的一种有前途的解决方案,这可能有利于提高各种空地协作任务的效率。为了确保稳定的栖息,稳定的相对状态和可靠的感知跟踪是先决条件。本文提出了一种用于自主四旋翼飞行器的自适应动态跟踪和栖息方案,以实现与移动平台的紧密集成 ...
我们为深度强化学习方法引入了探索奖励,该方法易于实现,并且对执行的计算增加的开销最小。奖励是神经网络预测固定随机初始化神经网络给出的观察特征的误差。我们还引入了一种灵活结合内在奖励和外在奖励的方法 ...
大量文档数据以非结构化形式存在,例如没有任何文本信息的原始图像。设计实用的文档图像分析系统是一项有意义但具有挑战性的任务。在之前的工作中,我们提出了一种智能文档分析系统PP-Structure ...
状态空间模型 (SSM) 已成为顺序建模领域的有力竞争者,挑战了 Transformers 的主导地位。与此同时,Mixture of Experts (MoE) 显着改进了基于 Transformer 的大型语言模型,包括最近最先进的开放模型。我们建议,为了释放 SSM 的扩展潜力,它们应该与 MoE 结合起来 ...
当前以事件为中心的知识图高度依赖显式连接词来挖掘事件之间的关系。不幸的是,由于连接词的稀疏性,这些方法严重破坏了 EventKG 的覆盖范围。缺乏高质量的标记语料库进一步加剧了这个问题 ...
我们提出了一种新的表格结构识别(TSR)方法,称为 TSRFormer,可以从各种表格图像中稳健地识别具有几何扭曲的复杂表格的结构。与之前的方法不同,我们将表分隔线预测制定为线回归问题而不是图像分割问题,并提出了一种新的基于 DETR 的两阶段分隔符预测方法,称为 \textbf{Sep}arator \textbf{RE}gression \textbf{ TR}ansformer (SepRE ...