数据增强旨在丰富训练样本,以缓解资源匮乏或类别不平衡情况下的过度拟合问题。传统方法首先设计同义词替换等针对特定任务的操作,然后人为预设替换率等相应参数,需要大量先验知识,并且容易陷入次优。此外,以前的方法中编辑操作的数量受到限制,这降低了增强数据的多样性,从而限制了性能增益 ...

0 0 0 0 2024/04/27 arXiv:2109.00523v1 deralnhund

尽管时间变量很重要,但它在 NLP 和语言模型文献中基本上被忽视了。在本文中,我们提出了 TimeLM,这是一组专门研究历时 Twitter 数据的语言模型。我们表明,持续学习策略有助于增强基于 Twitter 的语言模型处理未来和未分发推文的能力,同时使其与标准化和更单一的基准相比具有竞争力 ...

0 0 0 0 2024/04/26 arXiv:2202.03829v2 deralnhund

高分辨率卫星影像可以为土地覆盖分类提供丰富、详细的空间信息,这对于研究复杂的建筑环境尤为重要。然而,由于复杂的土地覆盖模式、昂贵的训练样本收集以及卫星图像分布的严重变化,很少有研究将高分辨率图像应用于大比例尺详细类别的土地覆盖制图。为了填补这一空白,我们提出了一个大规模土地覆盖数据集,即 50 亿像素 ...

0 0 0 0 2024/04/24 arXiv:2209.00727v2 deralnhund

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)