在社交媒体推荐系统中,终身顺序建模(LSM)变得越来越重要,以预测向用户提供的项目的点击率(CTR)。此过程的核心是注意机制,它从用户序列中提取有关候选项目的兴趣表示。通常,注意机制以一种重点的方式运行,仅关注序列中各个项目与候选项目的相关性 ...
扩散模型的最新进展已使高质量的视频生成,但是额外的时间维度显着提高了计算成本,从而使长期视频的培训和推断非常昂贵。在本文中,我们确定了一种现象,我们在视频扩散模型中称呼时空能量衰减:随着 Token 之间的空间和时间距离增加,类似于自然界和时间上的信号衰减或自然界时间的物理衰减,柔软后的注意力评分会降低。在此激励的情况下,我们提出了径向关注,这是一种具有$ O(n \ log n)$复杂性的可扩展 ...
自动唇部阅读(ALR)的目的是从视频中捕获的扬声器的无声唇部运动中自动转录口头内容。当前主流唇读方法仅使用单个视觉编码器来建模单个刻度的输入视频。在本文中,我们建议通过合并多尺度视频数据和多编码器来增强口头阅读 ...
在本报告中,我们介绍了QWEN2.5,这是一系列旨在满足各种需求的大型语言模型(LLMS)。与以前的迭代相比,QWEN 2 ...
大语言模型(LLMS)的训练后量化(PTQ)具有减少推理时降低过度计算成本的希望。由于激活中极端异常值引起的高量化误差,对所有重量,激活和键值(KV)缓存张量的量子不显着降低是有挑战性的。为了解决这个问题,我们提出了RESQ,RESQ是一种PTQ方法,可以进一步推动最先进的方法 ...
在在线数字广告领域中,转换率(CVR)预测在最大化每次转换成本(CPA)模型下的收入中起着关键作用,在这些模型下,只有在用户完成特定的操作(例如进行购买)时,广告客户只会收取广告客户的费用。 CVR预测中的一个主要挑战在于延迟的反馈问题会议可能会发生数小时甚至在初次用户互动后数小时。这种延迟使模型训练复杂化,因为最近的数据可能不完整,导致偏见和性能下降 ...
对现代通才政策的全面,公正和可比较的评估是一个独特的挑战:机器人基准测试的现有方法通常依赖于重型标准化,要么通过指定固定的评估任务和环境,要么通过主机进行集中的“机器人挑战”,并且不需要在整个任务和环境中评估通用策略。在这项工作中,我们提出了Roboarena,这是一种可扩展评估通才机器人政策的新方法。我们建议在分布式评估者网络上进行群源评估,而不是围绕固定任务,环境或位置进行标准化评估 ...
由于其不同的应用程序方案,表格数据生成最近引起了人们的兴趣。但是,生成表格数据的时间序列(该系列的每个元素都取决于其他元素)仍然是一个未开发的域。该差距可能是由于难以联合解决不同问题的困难,其中的主要问题是表格数据的异质性(非依赖于时间依赖性方法的问题)和时间序列的可变长度 ...