一译 —— 文档和论文翻译、对照阅读、讨论和社区

Intent-aware Ranking Ensemble for Personalized Recommendation

排名集合是实际推荐系统中的关键组件。当用户访问平台时，系统将准备多个项目列表，每个项目列表通常来自单个行为目标建议模型。作为多种行为意图，e ...

0 0 0 2025/06/18 arXiv:2304.07450v1 hitleo

Adapting Whisper for Streaming Speech Recognition via Two-Pass Decoding

Openai Whisper是一个在680,000小时的音频训练的良好自动语音识别（ASR）模型的家族。但是，它的编码器架构进行了序列到序列目标训练，因此缺乏对流媒体流的本地支持。在本文中，我们通过采用统一的两通道（U2）结构来微调用于使用WENET工具包流式ASR的耳语 ...

0 0 0 2025/06/18 arXiv:2506.12154v1 fucs

MovieChat+: Question-aware Sparse Memory for Long Video Question Answering

最近，集成视频基础模型和大型语言模型来构建视频理解系统可以克服特定的预定义视力任务的局限性。但是，现有方法要么采用复杂的时空模块，要么严重依赖其他感知模型来提取时间特征以供视频理解，并且它们只能在短视频中表现良好。对于长期视频，与长期时间连接相关的计算复杂性和记忆成本显着增加，从而提出了Atkinson-Shiffrin内存模型的此额外的HTTP URL优势，并且在 Transformer 中使用 ...

0 0 0 2025/06/18 arXiv:2404.17176v1 Leonliu022

Weak convergence of robust functions on topological groups

在本文中，我们为拓扑空间的水平功能引入了弱版和题词收敛。在拓扑组的特定情况下，我们能够在一组级别函数中定义卷积，并表明任何此类功能都是稳健函数的级别和层次的限制 ...

0 0 0 2025/06/18 arXiv:2002.00408v1 DrowXG

Learning coordinated badminton skills for legged manipulators

在机器人技术中，尤其是在动态环境中，协调上肢和上肢之间的运动以及将肢体控制与感知对齐的挑战是重大挑战。为此，我们介绍了一种方法，可以使腿部移动操纵器能够扮演羽毛球，这项任务需要精确的感知，运动和手臂摇摆的任务。我们为全身视觉运动技能提出了统一的强化学习政策，涉及各个自由度，以实现有效的Shuttlecock跟踪和引人注目 ...

0 0 0 2025/06/18 arXiv:2505.22974v1 yydsdsyy

DaGAN++: Depth-Aware Generative Adversarial Network for Talking Head Video Generation

关于交谈的人的主要技术在很大程度上取决于2D信息，包括面部表面图像的面部外观和动作。然而，诸如像素深度等密集的3D面部几何形状在构建准确的3D面部结构和抑制发电的复杂背景噪声方面起着至关重要的作用。但是，面部视频的致密3D注释要昂贵 ...

0 0 0 2025/06/18 arXiv:2305.06225v2 serein

The DeepFake Detection Challenge (DFDC) Dataset

DeepFakes是一种最近的现成操纵技术，可让任何人在单个视频中交换两个身份。除了深击外，还使用随附的代码发布了各种基于GAN的面部交换方法。为了应对这一新兴威胁，我们构建了一个非常大的面部交换视频数据集，以实现检测模型的培训，并组织了伴随的深层检测挑战（DFDC）Kaggle竞争 ...

0 0 0 2025/06/18 arXiv:2006.07397v4 serein

On the Multi-turn Instruction Following for Conversational Web Agents

由大型语言模型（llm）提供支持的web代理在复杂的基于web的环境中规划和执行多步骤交互方面表现出了卓越的能力，web，web导航任务。尽管取得了这些进步，llm支持的代理在现实场景中有效地处理顺序用户指令的潜力尚未得到充分探索。在这项工作中，我们引入了会话式web，web，该任务需要与用户和环境进行多个回合的复杂交互，该任务需要与用户和环境进行多个回合的复杂交互，并由专门开发的名为，并由专门开 ...

0 0 0 2025/06/18 arXiv:2402.15057v1 luhengtong

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）