在大规模推荐系统中,用户保留已成为一个关键挑战,从而显着影响在线平台的长期成功。现有方法通常集中在短期参与度指标上,未能捕获长时间的用户偏好和行为的复杂动态。尽管增强学习(RL)方法在优化长期奖励方面表现出了希望,但在应用于用户保留问题时,它们在信用分配,样本效率和探索方面面临困难 ...
0 0 0 2025/04/22 arXiv:2504.05628v1 张建华
开发能够穿越各种现实世界地形的两足机器人提出了基本的机器人挑战,因为使用预定义的高度图和静态环境的现有方法无法解决非结构化景观的复杂性。为了弥合这一差距,我们提出了Gente,这是一个框架,用于产生身体上现实和适应性的地形来训练可概括的运动政策。 Gente构建了一个原子地形图书馆,其中包括几何和物理地形,为基于增强学习的运动策略提供了课程培训 ...
0 0 0 2025/04/22 arXiv:2504.09997v1 jesson
图是视觉语言的基本形式,通过结构化符号,形状和空间布置代表复杂的概念及其相互关系。与自然图像不同,它们固有的象征性和抽象性质对多模式大语模型(MLLM)构成了重大挑战。但是,当前的基准测试将感知和推理任务混为一谈,因此很难评估MLLM是否真正理解超出表面模式识别的数学图 ...
0 0 0 2025/04/22 arXiv:2503.20745v1 Dreamer
作为多视图学习和多标签分类的跨主题,近年来,多视图多标签分类逐渐获得了吸引力。多视图对比学习的应用进一步促进了这一过程,但是,现有的多视图对比学习方法粗略地将所谓的负面对分开,这在很大程度上导致了属于同一类别或相似类别的样本的分离。此外,许多多视图的多标签学习方法忽略了可能缺少观点和标签的方法 ...
0 0 0 2025/04/22 arXiv:2303.17117v3 smallz
对比语言图像预处理(剪辑)的日益普及已导致其在各种视觉下游任务中的广泛应用。为了提高剪辑的有效性和多功能性,已广泛采用了有效的几次适应技术。在这些方法中,无训练方法,尤其是由Tip-Adapter举例说明的缓存方法,引起了人们的重量适应,而无需进行额外的微调 ...
0 0 0 2025/04/22 arXiv:2501.11175v1 hhhzzz
大规模预训练的最新进展表明,有可能学习下游任务的可推广表示。但是,在图形域中,捕获和传输跨不同图形域的结构信息仍然具有挑战性,这主要是由于跨各种情况的拓扑模式的固有差异。此外,大多数现有模型都难以捕获丰富的图形结构的复杂性,从而导致对嵌入空间的探索不足 ...
0 0 0 2025/04/22 arXiv:2504.10917v1 wozengyi
生成模型通常通过匹配流量或分数将噪声映射到数据,但是这些方法对于融合部分观测或其他先验而变得笨拙。受Wasserstein梯度流的最新进展的启发,我们提出了能量匹配,该框架将基于流量的方法统一了基于能量的模型(EBM)的灵活性。远离数据歧管,样品沿着无卷曲的最佳传输路径从噪声到数据移动 ...
0 0 0 2025/04/22 arXiv:2504.10612v1 odenkkk
这项工作提供了对训练 Transformer 的首次理论分析,以通过递归产生中间状态来解决复杂问题,该状态类似于对经过三通链(COT)推理的微调。我们考虑培训一层 Transformer 来解决基本的$ k $  - 准则问题,从而扩展了Wies等人(2023)对RNN的工作 ...
0 0 0 2025/04/22 arXiv:2410.08633v3 odenkkk

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)