姿势控制的角色视频生成的需求量很高,在社交媒体平台上的自动广告和内容创建等领域的广泛应用。尽管使用姿势序列和参考图像的现有角色图像动画方法显示出令人鼓舞的性能,但在复杂的场景中,例如多个角色动画和身体遮挡,它们倾向于与不连贯的动画作斗争。此外,当前的方法请求具有稳定背景和时间一致性的大规模高质量视频作为培训数据集,否则,其性能将大大恶化 ...
0 0 0 2025/03/11 arXiv:2406.03035v4 samuraichamploo
大型语言模型(LLMS)依靠键值(KV)缓存来存储 Token 历史记录,从而有效地解码 Token 。随着KV-CACHE的增长,它成为主要的内存和计算瓶颈,但是,有机会减轻这种瓶颈,尤其是因为先前的研究表明,只有一小部分 Token 对每个解码步骤都有有意义的贡献。找到这些关键 Token 的一个关键挑战是它们是动态的,并且非常依赖于输入查询 ...
0 0 0 2025/03/11 arXiv:2503.07518v1 haoyb22
点击率(CTR)预测是在线广告和建议的基本任务之一。尽管多层感知器(MLP)在许多深CTR预测模型中都是核心组件,但已广泛认识到,仅应用香草MLP网络仅应用于学习乘法特征交互的效率低下。因此,许多两流相互作用模型(e ...
0 0 0 2025/03/11 arXiv:2304.00902v4 hokirn
公开的视觉基础模型 (VFM),例如 CLIP 和分段任意模型 (SAM),正在迅速扩大。 VFM 因其预训练目标而被赋予了独特的功能。例如,CLIP 擅长语义理解,而 SAM 擅长分割的空间理解 ...
0 0 0 2025/03/11 arXiv:2310.15308v4 Archer
现有特定领域的大语言模型(LLMS)通常是通过具有大规模领域特异性语料库的微调通用LLM来开发的。但是,对大规模语料库的培训通常无法有效地组织LLM的领域知识,从而导致理解分散。受到人类如何联系概念并通过思维图组织知识的启发,我们旨在通过使用层次概念知识的本体论来模仿这种方法,以重新组织LLM的领域知识 ...
0 0 0 2025/03/11 arXiv:2502.05478v1 spiritedge
为了确保在线服务系统的性能,通过各种软件和系统指标密切监视其状态。性能异常代表性能降解问题(例如 ...
0 0 0 2025/03/11 arXiv:2201.02944v4 Nxixi
一阶段对象检测通常是通过优化两个子任务来实现的:对象分类和本地化,使用具有两个并行分支的头部,这可能导致两个任务之间预测的一定水平的空间未对准。在这项工作中,我们提出了一个任务一致的单阶段对象检测(TOOD),该对象检测以基于学习的方式显式地对齐这两个任务。首先,我们设计了一个新颖的任务一致的头(T-Head),在学习任务相互作用和特定任务的功能之间提供了更好的平衡,以及通过任务对准预测指标来学习 ...
0 0 0 2025/03/11 arXiv:2108.07755v3 18804024672
恶意的Python软件包使软件供应链通过在诸如Python软件包索引(PYPI)之类的开源存储库中利用信任来易受伤害。缺乏实时行为监控使元数据检查和静态代码分析不足以针对高级攻击策略,例如打字,秘密远程访问激活和动态有效载荷生成。为了应对这些挑战,我们介绍了PYPI的基于机器学习(ML)的动态分析框架Dysec,该框架使用EBPF内核和用户级探针在包装安装过程中监视行为 ...
0 0 0 2025/03/11 arXiv:2503.00324v1 ctf101

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)