近年来,预训练技术已在多种 NLP 任务中得到成功验证。尽管预训练模型广泛用于 NLP 应用,但它们几乎完全专注于文本级操作,而忽略了对于文档图像理解至关重要的布局和样式信息。在本文中,我们提出了 \textbf{LayoutLM} 来联合建模扫描文档图像中文本和布局信息之间的交互,这有利于大量现实世界文档图像理解任务,例如从扫描文档中提取信息 ...

0 1 1 3 2024/03/26 arXiv:1912.13318v5 云汐瑶

大型语言模型(LLM)已经证明了它们在上下文中学习的能力,使它们能够基于一些输入输出示例执行各种任务。然而,情境学习的有效性在很大程度上取决于所选示例的质量。在本文中,我们提出了一种新颖的框架来迭代训练密集检索器,该检索器可以为 LLM 识别高质量的上下文示例 ...

0 0 0 0 2024/04/18 arXiv:2307.07164v2 云汐瑶

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)