诸如OpenAI O1和DeepSeek-R1之类的大型推理模型在推理领域取得了出色的性能。他们培训的一个关键组成部分是将可验证的奖励纳入加固学习(RL)。但是,现有的奖励基准并未评估基于参考的奖励系统,使研究人员对RL中使用的验证者的准确性有限 ...
0 0 0 2025/05/22 arXiv:2505.15801v1 chrisxiong
将自然语言转化为正式语言,例如一阶逻辑(FOL)是NLP中的基础挑战,其在自动推理,错误信息跟踪和知识验证方面具有广泛的应用。在本文中,我们将自然语言引入一阶逻辑(NL2FOL),这是一个框架,将自然语言自动化为使用大型语言模型(LLMS)逐步地逐步为FOL。我们的方法解决了这种翻译过程中的关键挑战,包括集成隐式背景知识 ...
0 0 0 2025/05/22 arXiv:2405.02318v3 sunhw
最近,大型推理模型通过采用类似人类的深思熟虑,在各种任务上取得了令人印象深刻的表现。但是,漫长的思维过程大大增加了推理开销,使效率成为关键的瓶颈。在这项工作中,我们首先证明了NotHinking促使推理模型跳过思维并直接生成最终解决方案,这是在性能和​​效率方面相对简单任务的更好选择 ...
0 0 0 2025/05/22 arXiv:2505.13417v1 lishiqi01
自动化的脑肿瘤分割方法已经建立了良好的表现水平,可提供明确的临床实用性。这些方法通常依赖于四个输入磁共振成像(MRI)方式:具有和不具有对比度增强的T1加权图像,T2加权图像和Flair图像。但是,由于时间限制或图像伪像,例如患者运动,通常在临床实践中通常缺少某些序列 ...
0 0 0 2025/05/22 arXiv:2305.09011v6 aaaa1
阶段信息对语音感知质量和清晰度有重大影响。但是,由于该阶段的非结构性和包装特征,现有的语音增强方法在显式阶段估计中遇到了限制,从而导致瓶颈具有增强的语音质量。为了克服上述问题,在本文中,我们提出了MP-SENET,这是一个新型的语音增强网络,可显式增强幅度和相光谱 ...
0 0 1 2025/05/22 arXiv:2308.08926v2 fsix
源代码摘要涉及创建自然语言中源代码的简要描述。这些描述是软件文档(例如Javadocs)的关键组成部分。自动代码摘要是软件工程研究的珍贵目标,因为对程序员的价值很高,并且同时撰写和维护文档的成本高 ...
0 0 0 2025/05/22 arXiv:2204.01632v1 UUU
在简短的视频和直播混合建议方案的背景下,实时流推荐系统(RS)决定是否最多将一个实时流分配到每个用户请求的视频供稿中。为了最大程度地提高长期用户参与度,至关重要的是确定最佳的实时流策略以进行准确的实时流分配。不适当的实时流分配策略可以显着影响使用应用程序和用户保留的持续时间,这忽略了实时流分配的长期负面影响 ...
0 0 0 2025/05/22 arXiv:2412.10381v5 zengyanxiang
代码摘要和生成授权编程语言(PL)和自然语言(NL)之间的转换,而代码翻译则可以从一个PL到另一个PL的旧代码迁移。本文介绍了PLBART,这是一个序列到序列模型,能够执行各种程序,语言理解和生成任务。 PLBART通过DeNoing自动编码进行了广泛的Java和Python功能和相关的NL文本的广泛收集 ...
0 0 0 2025/05/22 arXiv:2103.06333v2 UUU

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)