一译 —— 文档和论文翻译、对照阅读、讨论和社区

Scenario-Adaptive Fine-Grained Personalization Network: Tailoring User Behavior Representation to the Scenario Context

现有方法通常仅在汇总用户行为序列后自适应地调整表示。这种重新加权整个用户序列重新加权的粗粒方法阻碍了模型在不同情况下准确建模用户兴趣迁移的能力。为了增强模型在每种情况下从历史行为序列中捕获用户兴趣的能力，我们开发了一个名为“方案 - 适应性精细颗粒个性化网络（SFPNET）”的排名框架，该网络（SFPNET）设计了一种针对多范围的个性化个性化建议的精细粒度方法 ...

0 0 0 2025/04/21 arXiv:2404.09709v3 Leeyhom

Unified World Models: Coupling Video and Action Diffusion for Pretraining on Large Robotic Datasets

模仿学习已成为建立通用机器人的有前途的方法。但是，由于依赖高质量的专家演示，大型机器人基础模型的缩放模仿学习仍然具有挑战性。同时，大量的视频数据描绘了广泛的环境和各种行为 ...

0 0 0 2025/04/21 arXiv:2504.02792v2 陆三七

LoRACLR: Contrastive Adaptation for Customization of Diffusion Models

文本到图像定制的最新进展使高保真，上下文丰富的个性化图像产生，使特定概念可以在各种情况下出现。但是，当前的方法与将多个个性化模型相结合，通常会导致属性纠缠或需要单独的培训以保持概念的独特性。我们提出了Loraclr，这是一种用于多概念图像生成的新型方法，该方法将多个Lora模型合并，每个模型都以不同的概念进行了微调，将其合并为一个单一的统一模型，而无需其他单独的微调 ...

0 0 0 2025/04/21 arXiv:2412.09622v1 szbbob

OwlSight: A Robust Illumination Adaptation Framework for Dark Video Human Action Recognition

在弱光环境中的人类行动识别对于各种现实世界应用至关重要。但是，现有方法在整个训练阶段都忽略了亮度信息的全面利用，从而导致了次优的性能。为了解决这一限制，我们提出了Owlsight，这是一个具有仿生型启发的框架，具有整个阶段照明增强，以与动作分类相互作用，以进行准确的黑暗视频人类动作识别 ...

0 0 0 2025/04/21 arXiv:2503.23266v1 dabanqiao

Self-Rewarding Language Models

We posit that to achieve superhuman agents, future models require superhuman feedback in order to provide an adequate training signal. Current approaches commonly train reward models from human prefer ...

0 0 0 2025/04/21 arXiv:2401.10020v3 leec

Generative Recommender with End-to-End Learnable Item Tokenization

最近，生成式推荐已经成为一种有前途的新范式，它可以直接生成用于推荐的项目标识符。然而，一个关键的挑战在于如何有效地构建适合推荐系统的项目标识符。现有方法通常将项目标记化与后续生成推荐训练分离，可能导致性能不佳 ...

0 0 0 2025/04/21 arXiv:2409.05546v2 yushun

iTool: Boosting Tool Use of Large Language Models via Iterative Reinforced Fine-Tuning

使用外部工具增强大型语言模型（LLM）是增强其功能的一种有前途的方法，尤其是对于复杂的任务。通过现实世界仿真综合使用工具使用数据是实现它的有效方法。然而，我们的调查表明，（1）随着综合数据的增加，培训显着衰减 ...

0 0 0 2025/04/21 arXiv:2501.09766v3 yang1young

A Survey of Personalization: From RAG to Agent

个性化已成为现代AI系统中的重要能力，从而实现了与单个用户偏好，上下文和目标保持一致的自定义交互。最近的研究越来越集中于检索演出的生成（RAG）框架及其在个性化设置中基于高级代理的架构以增强用户满意度。在该基础的基础上，这项调查系统地检查了抹布的三个核心阶段的个性化：返回前，检索和一代 ...

0 0 0 2025/04/21 arXiv:2504.10147v1 zl1994

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）