在优化顺序推荐任务中的长期用户参与时,强化学习 (RL) 算法受到越来越多的关注。大规模在线推荐系统面临的挑战之一是用户行为模式的持续而复杂的变化,例如交互率和保留倾向。当将其表述为马尔可夫决策过程(MDP)时,推荐系统的动态和奖励函数会不断受到这些变化的影响 ...
0 0 0 2025/05/13 arXiv:2310.03984v3 qf_ml
在本文中,我们介绍了 DiarizationLM,这是一个利用大型语言模型 (LLM) 对说话者二值化系统的输出进行后处理的框架。使用所提出的框架可以实现各种目标,例如提高分类记录的可读性,或降低单词分类错误率(WDER)。在此框架中,自动语音识别(ASR)和说话人分类系统的输出表示为紧凑的文本格式,该格式包含在可选微调的 LLM 的提示中 ...
0 0 0 2025/05/13 arXiv:2401.03506v11 leosurre
虽然最近基于图像的人类动画方法实现了现实的身体和面部运动综合,但临界差距仍保持精细的整体可控性,多尺度适应性和长期的时间连贯性,从而导致其较低的表现力和稳健性。我们提出了一个基于扩散 Transformer (DIT)的框架Dreamactor-M1,并通过混合指导来克服这些限制。为了进行运动引导,我们的混合控制信号集成了隐式面部表示,3D头部球和3D身体骨架,可实现对面部表情和身体运动的强大控制 ...
0 0 0 2025/05/13 arXiv:2504.01724v3 JyEeee
知识图(kg)归纳推理旨在推断培训期间未见的新kg的缺失事实,在各种应用中已被广泛采用。 KG归纳推理的一个关键挑战是在文本和结构方面处理低资源场景,均缺乏。在本文中,我们试图通过大型语言模型(LLM)来应对这一挑战 ...
0 0 0 2025/05/13 arXiv:2402.11804v3 aulisa
在药物发现中,使用昂贵的湿lab实验确认计算模型的药物特性的预测至关重要。因此,获得可靠的不确定性估计值对于对随后的实验验证的优先级排序至关重要。共形预测(CP)是为具有覆盖范围保证的分子特性创建这样的预测集的有前途的工具 ...
0 0 0 2025/05/13 arXiv:2310.12033v1 younglight25
由于缺乏将音频信号与以推理为导向的文本分析相结合的高质量多模式训练数据,因此对电信欺诈的检测面临重大挑战。为了解决这一差距,我们提出了Teleantifraud-28K,这是第一个专门为自动电信欺诈分析设计的开源音频 - 文本慢思维数据集。我们的数据集是通过三种策略来构建的:(1)使用自动语音识别(ASR)转录的呼叫记录(带有匿名的原始音频)的隐私文本真实示例生成,从而确保通过文本对语音(TTS) ...
0 0 0 2025/05/13 arXiv:2503.24115v3 kbwzy
最近的研究表明,大型语言模型(LLMS)可以利用低精确的浮点(FP)量化来提供高效率,同时保持原始模型的准确性。特别是,最近的作品表明了非电力精度(例如FP6和FP5)的有效性,以及对LLM层的低精度算术的敏感性,这激励了混合精度算术,包括LLMS中的非功率 - 两个精度。尽管低精度算法从较低的计算开销中导致了低计算的开销,但由于硬件约束支持有限的两个精度,因此无法完全利用此类好处(e ...
0 0 0 2025/05/13 arXiv:2411.18065v1 jane88
使用更多数据,计算和参数缩放语言模型已推动了自然语言处理的重大进展。例如,由于扩展,GPT-3能够在内在学习任务上取得强大的结果。但是,培训这些大型密集的模型需要大量的计算资源 ...
0 0 0 2025/05/13 arXiv:2112.06905v2 anhao

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)