- 名称
- SVTR: Scene Text Recognition with a Single Visual Model
- 描述
主要场景文本识别模型通常包含两个构建块:用于提取特征的视觉模型和用于文本校正的序列模型。这种混合架构虽然准确,但很复杂且效率较低。在本研究中,我们提出有了一个在分块图像标记化框架内用于场景文本识别的单一模型,该模型完全省去了顺序建模...... ...
主要场景文本识别模型通常包含两个构建块:用于提取特征的视觉模型和用于文本校正的序列模型。这种混合架构虽然准确,但很复杂且效率较低。在本研究中,我们提出有了一个在分块图像标记化框架内用于场景文本识别的单一模型,该模型完全省去了顺序建模...... ...