腿部机器人运动的最新成功归因于增强学习和物理模拟器的整合。但是,由于模拟器通常无法复制视觉现实主义和复杂的现实世界几何形状,因此由于SIM到真实的空白而部署在现实世界环境中时,这些策略通常会遇到挑战。此外,缺乏现实的视觉渲染限制了这些政策支持需要基于RGB的感知(例如以自我为中心的导航)的高级任务的能力 ...
异质效应估计在因果推论中起着至关重要的作用,在医学和社会科学上的应用。近年来已经提出了许多用于估计条件平均治疗效果(CATE)的方法,但是在理解该方法是否以及何时最佳的理论差距中存在重要的理论差距。当Cate具有非平凡结构时,尤其如此(e ...
在点击率(CTR)预测中,包括用户长期与项目的历史互动的长期行为顺序对评估用户对候选项目的兴趣具有至关重要的影响。现有方法通过两个阶段的范式进行打击效率和有效性:首先检索数百个与候选相关的项目,然后通过目标注意力提取兴趣强度向量。但是,我们认为,目标注意力的相关性分布在检索到的项目和完整的长行为序列之间的差异不可避免地会导致绩效下降 ...
在在线视频平台中,准确的观看时间预测已成为视频推荐中的一个基本且具有挑战性的问题。先前的研究表明,观察时间预测的准确性在很大程度上取决于手表标签的转换和估计过程的分解。 TPM(基于树的渐进回归模型)通过精心设计和有效的分解范式实现最先进的性能 ...
自我监视的视觉模型的恐龙家族表现出了显着的可转移性,但有效地调整其对细分的表示仍然具有挑战性。现有的方法通常依赖于具有多尺度融合或复杂上采样的重型解码器,这引入了大量参数开销和计算成本。在这项工作中,我们提出了Segdino,这是一个有效的分割框架,该框架将冷冻的Dinov3骨架与轻量级解码器融合在一起 ...
推荐系统(RSS)对于电子商务平台可帮助满足用户的巨大需求至关重要。如何捕捉用户兴趣并为异类电子商务方案中的用户提出准确的建议仍然是一个持续的研究主题。但是,大多数现有研究忽略了情景的内在关联:从平台收集的日志数据可以自然分为不同的场景(e ...
我们介绍了Onecat,这是一个统一的多模型模型,将理解,生成和编辑无缝整合到新颖的纯解码 Transformer 体系结构中。我们的框架独特地消除了对推理期间视觉 Transformer (VIT)或视觉 Token 等外部组件的需求,从而导致效率显着提高,尤其是对于高分辨率输入。这是通过具有单个自回归(AR)物镜训练的特定于模式的特定于特定于特定的专家(MOE)结构来实现的,该物镜还本地支持动 ...
随着扩散模型的出现,文本驱动的运动产生已取得了重大进步。但是,现有方法仍然难以生成与细粒描述相对应的复杂运动序列,描绘了详细而准确的时空作用。这种缺乏可控性将运动产生的用法限制在更大的受众群体上 ...