arxiv LAPDoc: Layout-Aware Prompting for Documents

名称
LAPDoc: Layout-Aware Prompting for Documents
首页
https://yiyibooks.cn/arxiv/2402.09841v1/index.html
原始地址
https://arxiv.org/pdf/2402.09841.pdf
描述
使用大量纯文本数据训练大型语言模型 (LLM) 的最新进展导致跨许多领域和任务(包括特定于文档的任务)的强泛化。与此相反,有一种趋势是训练专为文档理解而定制的多模式 Transformer 架构,这些架构专门设计用于将文本输入与相应的文档布局融合。这涉及一个单独的微调步骤,需要额外的训练数据 ...