当与 Lean 等交互式证明助手集成时,大型语言模型 (LLM) 在数学推理任务(例如形式定理证明)中取得了成功。现有的方法涉及在特定数据集上训练或微调 LLM ,以使其在特定领域(例如本科水平的数学)表现良好。这些方法很难推广到高等数学 ...
0 0 0 2024/11/01 arXiv:2410.06209v5 Frazy
指令调优是一种新的学习范式,可根据指令指定的任务对预先的语言模型进行训练,它在各种自然语言处理任务上显示出希望的零样本性能。和多模式任务还有待探索。在这项工作中,我们介绍了 MUL-TIINSTRUCT,这是第一个多模式指令调优基准数据集,它由 62 个不同的多模式任务组成,采用统一的 seq -to-seq 格式,涵盖 10 个大类 ... ...
0 0 0 2024/11/01 arXiv:2212.10773v3 APlayBoy
以前的多任务密集预测研究开发了复杂的管道,例如多个阶段的多模式蒸馏或搜索每个任务的任务关系上下文。这些方法之外的核心见解是最大化每项任务的相互影响。受最近基于查询的 Transformer 的启发,我们提出了一种名为多查询转换器(MQTransformer)的简单管道,它配备了来自不同任务的多个查询,以方便多个任务之间的推理并简化跨任务交互管道 ...
0 0 0 2024/10/31 arXiv:2205.14354v4 hesy77
自监督表示学习在许多领域都取得了显着的成功。常见的做法是通过手工转换来执行数据增强,旨在保持数据的语义不变。我们试图从理论角度理解这种方法的经验成功 ...
0 0 0 2024/10/31 arXiv:2106.04619v4 Nxixi
因果关系的不变性原理是一些著名方法的核心,例如寻求解决分布外(OOD)泛化失败的不变风险最小化(IRM)。尽管理论很有前途,但基于不变性原则的方法在常见的分类任务中失败了,其中不变(因果)特征捕获了有关标签的所有信息。这些失败是否是由于方法未能捕获不变性所致?还是不变性原理本身还不够?为了回答这些问题,我们重新审视线性回归任务中的基本假设,其中基于不变性的方法被证明可以推广 OOD ...
0 0 0 2024/10/31 arXiv:2106.06607v2 Nxixi
尽管最近在使用不变性原理对欧几里得数据(例如图像)进行分布外(OOD)泛化方面取得了成功,但对图数据的研究仍然有限 ...
0 0 0 2024/10/31 arXiv:2202.05441v3 Nxixi
时间序列基础模型在各种任务、跨广泛领域、甚至在零样本设置中都表现出了令人印象深刻的性能。然而,大多数这些模型都是为了处理短单变量时间序列作为输入而设计的。这限制了它们的实际使用,特别是在医疗保健等领域,这些领域具有大量长数据和多变量数据,并且具有很强的时间和变量内依赖性 ...
0 0 0 2024/10/31 arXiv:2409.13530v1 yzy
尽管近年来已经开发出有效的深度格式检测模型,但最近的研究表明,这些模型可能会导致种族和性别等人口群体之间的不公平表现差异。这可能会导致特定群体面临不公平的目标或被排除在检测之外,从而可能导致错误分类的深度格式化品整理公众判断并破坏对模型的信任。解决这个问题的现有方法是提供公平损失函数... ...
0 0 0 2024/10/31 arXiv:2402.17229v1 jeffrey188

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)