用嘈杂的标签进行深度学习是弱监督学习的一个有趣挑战。尽管具有很高的学习能力,但CNN仍具有在带有嘈杂标签的样品的情况下过度合适的趋势。减轻此问题,众所周知的共同培训框架被用作我们工作的基本基础 ...
0 0 0 2025/07/04 arXiv:2503.03042v1 snowpigppp
文本到歌曲的生成是通过文本输入创建人声和伴奏的任务,由于域的复杂性和数据稀缺而构成了重大挑战。现有方法通常采用多阶段生成程序,从而导致繁琐的培训和推理管道。在本文中,我们提出了Songgen,这是一种完全开源的,单阶段的自动回归 Transformer ,专为可控歌曲的生成而设计 ...
0 0 0 2025/07/04 arXiv:2502.13128v2 wkw1220632
幽默在日常语言交流中起着重要作用。随着大型语言模型(LLM)的快速发展,自然语言处理在理解和生成各种流派的文本方面取得了重大进步。但是,大多数LLM在产生和处理中国幽默方面表现出色 ...
0 0 0 2025/07/04 arXiv:2503.20417v1 kk1943
大型语言模型(LLMS)的最新进展已大大提高了文本到SQL任务的性能。但是,先前的方法通常依赖于推理时间提供的静态,预处理的数据库信息,这限制了模型充分理解数据库内容的能力。如果没有动态交互,LLM将被限制为固定的,人为提供的上下文,并且无法自主探索基础数据 ...
0 0 0 2025/07/04 arXiv:2506.07245v2 qzw
在文本到SQL任务的上下文中,表和列描述对于弥合自然语言和数据库架构之间的差距至关重要。本报告提出了一种方法,用于自动生成有效数据库描述时,当显式描述不可用时。所提出的方法采用双处理方法:一种粗到五个过程,然后进行精细到核的过程 ...
0 0 0 2025/07/04 arXiv:2502.20657v1 qzw
视觉语言模型(VLMS)显示出对自动驾驶的希望,但他们与幻觉,效率低下的推理和有限的现实验证的斗争阻碍了准确的感知和稳健的逐步推理。为了克服这一点,我们介绍了AgentThink,这是一个开创性的统一框架,该框架首次将思想链(COT)推理与动态,代理风格的工具调用有关自主驾驶任务。 AgentThink的核心创新包括:(i)结构化数据生成,建立一个自动驾驶工具库,以自动构建结构化的,自我验证的推理 ...
0 0 0 2025/07/04 arXiv:2505.15298v3 15021163060
幻觉仍然是LLM的持续挑战。抹布旨在通过在上下文中扎根响应来减少幻觉。但是,即使提供上下文,LLMS仍然经常引入不支持的信息或矛盾 ...
0 0 0 2025/07/04 arXiv:2505.04847v1 victoriaheiheihei
大型语言模型(LLMS)最近在软件工程任务上提出了许多应用程序,尤其是代码生成的潜力。在当代挑战中,LLMS产生的代码通常遭受不准确和幻觉的影响,需要纠正外部投入。解决这些问题的最新策略是使用模型本身的输入(自称)来完善LLMS生成的代码 ...
0 0 0 2025/07/04 arXiv:2408.15658v1 Momomo

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)