基本信息 - UMIE: Unified Multimodal Information Extraction with Instruction Tuning

arxiv UMIE: Unified Multimodal Information Extraction with Instruction Tuning

Star 0

阅读

名称: UMIE: Unified Multimodal Information Extraction with Instruction Tuning

首页: https://yiyibooks.cn/arxiv/2401.03082v1/index.html

原始地址: https://arxiv.org/abs/2401.03082

描述

随着多媒体含量的普及增加，多模式信息提取（MIE）引起了极大的关注。但是，当前的MIE方法通常使用特定于任务的模型结构，从而导致跨任务的可推广性有限，并且不足以跨MIE任务的共同知识。为了解决这些问题，我们提出了统一的多模式信息提取器Umie，将三个MIE任务统一作为使用指令调整的一代问题，能够有效地提取文本和视觉提及 ...

文件上传进度

0%

上传成功 0 个文件