我们提出了Talkplay,这是一种新型的多式音乐推荐系统,使用大语言模型(LLMS)重新定义了作为 Token 生成问题的建议。通过利用LLMS的指导跟踪和自然语言生成功能,我们的系统有效地推荐了来自不同用户查询的音乐,同时产生上下文相关的响应。虽然审计的LLM主要是为文本模式设计的,但Talkplay通过两个关键创新扩展了其范围:多模式音乐 Token 器,它编码音频功能,歌词,元数据,语义标 ...
0 0 0 2025/06/05 arXiv:2502.13713v4 Jodie
培训大语言模型(LLMS)是资源密集且昂贵的,这使得为LLMS保护知识产权(IP)至关重要。最近,将指纹嵌入LLMS已成为建立模型所有权的普遍方法。但是,现有的指纹技术通常嵌入具有弱语义连贯性的可识别模式,导致指纹与自然提问(QA)行为明显不同 ...
0 0 0 2025/06/05 arXiv:2503.21805v2 wuyi
通过可验证的奖励(RLVR)的强化学习是培训语言模型(LMS)的一种有前途的方法,这些方法是针对引发出现的长长思想链(COTS)的推理任务的一种有前途的方法。与受监督的学习不同,它通过策略梯度同时使用正确和不正确的样本更新模型。为了更好地理解其机制,我们将学习信号分解为加强正确的响应,并分别惩罚不正确的响应,分别称为正和负样品增强(PSR和NSR) ...
0 0 0 2025/06/05 arXiv:2506.01347v1 chrisxiong
强化学习算法是将大语言模型与人类偏好相结合并增强其推理能力的基础。但是,由于辅助模型引起的损失,当前的增强学习算法通常会遭受训练不稳定性的损失。在这项工作中,我们提出了具有最佳奖励基线(OPO)(一种新颖而简化的强化学习算法,旨在应对这些挑战的新颖而简化的增强算法) ...
0 0 0 2025/06/05 arXiv:2505.23585v2 chrisxiong
在2019年和2020年NEURIPS上的IARAI Traffic4Cast竞赛表明,神经网络可以成功地预测未来1小时的未来交通状况,仅在时间和太空垃圾箱中汇总的GPS探测数据。因此,我们重新解释了预测流量条件作为电影完成任务的挑战。 U-Nets被证明是获胜的体系结构,表明在这个复杂的现实世界地理空间过程中提取相关功能的能力 ...
0 0 0 2025/06/05 arXiv:2203.17070v2 psyduck1
质谱(MS)是化学分析的重要技术,它为样品计算高尺寸直方直方图样光谱。 MS数据处理的关键步骤是峰采摘,该峰选择选择了峰值,其中包含有关MS研究中感兴趣的高浓度分子的信息。我们提出了一个基于稀疏编码算法的峰采摘的新过程 ...
0 0 0 2025/06/05 arXiv:0907.3426v2 jeremychou
我们提出了一个新的问题集,文本语料库和基线,以鼓励AI研究中的AI研究。这些共同构成了AI2推理挑战(ARC),该挑战需要比以前的挑战(例如小队或SNLI)更强大的知识和推理。 ARC问题集分为挑战集和一个简单的集合,其中挑战集仅包含基于检索的算法和单词共存在算法错误回答的问题 ...
0 0 0 2025/06/05 arXiv:1803.05457v1 13530361597
组成零摄入学习(CZSL)旨在从所见的构图中学习视觉概念(即属性和对象),并将概念知识结合到看不见的构图中 ...
0 0 0 2025/06/05 arXiv:2303.15111v1 kkkkk

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)