- 名称
- LAPDoc: Layout-Aware Prompting for Documents
- 描述
使用大量纯文本数据训练大型语言模型 (LLM) 的最新进展导致跨许多领域和任务(包括特定于文档的任务)的强泛化。与此相反,有一种趋势是训练专为文档理解而定制的多模式 Transformer 架构,这些架构专门设计用于将文本输入与相应的文档布局融合。这涉及一个单独的微调步骤,需要额外的训练数据 ...
使用大量纯文本数据训练大型语言模型 (LLM) 的最新进展导致跨许多领域和任务(包括特定于文档的任务)的强泛化。与此相反,有一种趋势是训练专为文档理解而定制的多模式 Transformer 架构,这些架构专门设计用于将文本输入与相应的文档布局融合。这涉及一个单独的微调步骤,需要额外的训练数据 ...