Boltzmann方程通常用于研究粒子反应网络的热演化。突出的例子是宇宙的重子不对称性的计算以及相对论重离子碰撞后夸克 - 胶状等离子体的演变。但是,玻尔兹曼方程只是量子热化过程的经典近似,该过程由所谓的kadanoff-baym方程描述 ...
Equiformer 等等变 Transformer 已经证明了将 Transformer 应用到 3D 原子系统领域的功效。然而,由于计算复杂性,它们仅限于小程度的等变表示。在本文中,我们研究了这些架构是否可以很好地扩展到更高的程度 ...
任何模型2(SAM 2)的细分市场已成为图像和视频中对象分割的强大基础模型,为各种下游视频应用程序铺平了道路。 SAM 2用于视频分割的关键设计是其内存模块,该模块促使以前的框架预测从以前的帧中引起对象感知的记忆。但是,其贪婪选择的记忆设计遇到了“错误积累”问题,其中错误或错过的面具将级联和影响后续帧的分割,这将SAM 2的性能限制在复杂的长期视频中 ...
随着电信服务提供商将重点转移到分析包装设计和营销干预措施的用户行为上,一个关键的挑战在于开发一个统一的,端到端的框架,能够建模具有多种时间粒度,多模式数据输入的长期和周期性用户行为序列。本文介绍了GTS-LUM,这是一种新型的用户行为模型,可以重新定义电信设置中的建模范例。 GTS-LUM采用(多模式)编码器 - 适配器-LLM解码器体系结构,并通过几项特定于电信的特定创新来增强 ...
基于文本的协作过滤(TCF)已成为使用文本编码器(也称为语言模型(LMS))代表项目的文本和新闻建议的主流方法。但是,现有的TCF模型主要集中于使用中小型LMS。不确定如何用最大,功能最强大的LMS之一(例如1750亿个参数GPT-3模型)代替项目编码器,这对建议性能会产生什么影响 ...
在许多现实世界应用中,时间表分析非常重要。最近,在自然语言处理中流行的 Transformer 模型已被利用,以学习从时间表的高质量功能嵌入,核心到各种时间表分析任务的性能。但是,二次的时间和空间复杂性限制了变形金刚的可伸缩性,尤其是对于长时间工作 ...
交通模拟旨在学习一项交通代理的政策,当在闭环中展开时,忠实地恢复了现实世界中观察到的轨迹的共同分布。受大型语言模型的启发, Token 化的多代理政策最近已成为交通模拟的最新策略。但是,它们通常是通过开环行为克隆训练的,因此在模拟过程中在闭环中执行时会遭受协方差偏移 ...
反事实解释是对机器学习决策做出本地解释的常见方法。对于给定的实例,这些方法旨在找到特征值的最小修改,以改变机器学习模型做出的预测决策。反事实解释的挑战之一是有效地产生了现实的反事实 ...