大量文档数据以非结构化形式存在,例如没有任何文本信息的原始图像。设计实用的文档图像分析系统是一项有意义但具有挑战性的任务。在之前的工作中,我们提出了一种智能文档分析系统PP-Structure ...
我们为多智能体仅相信利用信念基础的语言提出了一种新颖的语义,并展示了如何使用它来自动检查该语言的公式及其与私人信念扩展算子的动态扩展。我们提供了一种用于模型检查的 PSPACE 算法,该算法依赖于 QBF 的简化,以及依赖于状态空间探索的替代专用算法。我们在具体示例中提出了基于 QBF 的算法的实现以及计算时间的一些实验结果 ...
在本报告中,我们介绍了 DocXChain,这是一个强大的文档解析开源工具链,其设计和开发的目的是将非结构化文档(例如文本、表格和图表)中包含的丰富信息自动转换为可读和可操作的结构化表示通过机器。具体来说,提供了文本检测、文本识别、表格结构识别、布局分析等基本能力。在这些基本能力的基础上,我们还构建了一套功能齐全的文档解析管道,即: ...
最近,由于对自动化文档理解的需求不断增长以及能够处理基于文档的问题的生成大型语言模型(LLM)的出现,视觉情境文本解析(VsTP)取得了显着的进步。人们提出了各种方法来解决 VsTP 的挑战性问题。然而,由于目标多样化和架构异构,以往的工作通常为各个任务设计特定于任务的架构和目标,这无意中导致了模式隔离和复杂的工作流程 ...
将文档解析为下游应用程序的结构化机器可读格式时,识别非结构化数字文档的布局是重要的一步。为计算机视觉开发的深度神经网络已被证明是分析文档图像布局的有效方法。然而,目前公开的文档布局数据集比已建立的计算视觉数据集小几个数量级 ...
本文提出了 LayoutLLM,一种更灵活的文档分析方法,用于理解图像文档。视觉丰富的文档理解任务,例如文档图像分类和信息提取,由于其重要性而受到广泛关注。现有的方法已经被开发出来,通过结合图像、文本和布局结构的预训练意识来增强文档理解 ...
本文提出了第一个基于 LLM 的小样本聊天机器人,它几乎从不产生幻觉,并且具有高会话性和低延迟。 WikiChat 以英语维基百科为基础,这是最大的精选自由文本语料库。 WikiChat 生成法学硕士的回复,仅保留有根据的事实,并将其与从语料库中检索到的其他信息相结合,形成事实且引人入胜的回复 ...
本次调查对多轮对话系统的研究进行了全面的回顾,特别关注基于大语言模型(LLM)的多轮对话系统。本文旨在 (a) 总结现有的法学硕士以及使法学硕士适应下游任务的方法; (b) 阐述多轮对话系统的最新进展,涵盖基于法学硕士的开放域对话(ODD)和面向任务的对话(TOD)系统,以及数据集和评估指标; (c) 讨论由于法学硕士的发展以及对多轮对话系统日益增长的需求而产生的一些未来重点和近期研究问题 ...