arxiv SVTR: Scene Text Recognition with a Single Visual Model

名称
SVTR: Scene Text Recognition with a Single Visual Model
首页
https://yiyibooks.cn/arxiv/2205.00159v2/index.html
原始地址
https://arxiv.org/pdf/2205.00159.pdf
描述
主要场景文本识别模型通常包含两个构建块:用于特征提取的视觉模型和用于文本转录的序列模型。这种混合架构虽然准确,但很复杂且效率较低。在本研究中,我们提出了一种在分块图像标记化框架内用于场景文本识别的单一视觉模型,该模型完全省去了顺序建模 ...