从高维顺序数据中提取有意义的潜在表示是机器学习的至关重要挑战,其应用程序涵盖了自然科学和工程。我们介绍了InfoDPCCA,这是一种动态概率的规范相关分析(CCA)框架,旨在模拟两个相互依存的观测序列。 InfoDPCCA利用一个新型的信息理论目标来提取共享的潜在表示,该图表捕获数据流和平衡表示压缩和预测充足性之间的相互结构,同时还学习了分别编码针对每个序列特定信息的潜在组件 ...

0 0 0 0 2025/07/08 arXiv:2506.08884v1 13080420360

捕获准确的声学现象的现实音频综合对于在虚拟和增强现实中创造沉浸式体验至关重要。综合在任何位置接收的声音都取决于脉冲响应(IR)的估计,该响应(ir)的特征是在到达听众的位置之前,声音在一个场景中沿着不同的路径传播。在本文中,我们提出了声学量渲染(AVR),这是一种新型方法,可适应体积渲染技术,以模拟声学脉冲响应 ...

0 0 0 0 2025/07/08 arXiv:2411.06307v1 wenwen

可穿戴智能设备的兴起通过无处不在的行为跟踪和指导为自我完善提供了前所未有的机会。但是,有效的可穿戴行为干预系统的设计仍然相对尚未探索。为了解决这一差距,我们进行了对照研究,重点是减少不必要的单词(e ...

0 0 0 0 2025/07/08 arXiv:2507.04238v1 zhangqi33

LLM驱动的多代理协作(MAC)系统在功能级别的自动软件开发方面表现出了令人印象深刻的功能。但是,他们对人类设计的极大依赖将其适应性限制在现实世界软件开发的各种需求中。为了解决这一限制,我们介绍了Evomac,这是一种新型的Mac网络自我发展范式 ...

0 0 0 0 2025/07/08 arXiv:2410.16946v1 Loong

近年来,视觉语言模型显示出令人印象深刻的进展。但是,现有的模型在很大程度上仅限于基于转弯的互动,每个转弯都必须逐步进行(即 ...

0 0 0 0 2025/07/08 arXiv:2407.08101v3 yanyu

许多现实世界应用(例如医疗保健和工业)中的多元时间序列数据信息丰富,但由于缺乏标签和高维度而具有挑战性 ...

0 0 0 0 2025/07/08 arXiv:2312.04142v3 13080420360

长尾识别是具有挑战性的,因为它要求模型从尾部类别中学习良好的表示,并解决所有类别的失衡。在本文中,我们提出了一个新颖的生成和微调框架LTGC,以通过利用生成的内容来处理长尾识别。首先,受大型模型中丰富的隐性知识的启发(e ...

0 0 0 0 2025/07/08 arXiv:2403.05854v4 zl1994

人类通过在时间和空间体验中利用长期记忆来执行复杂的任务擅长执行复杂的任务。相反,当前的大型语言模型(LLMS)努力在动态的多房间3D环境中有效地计划和行动。我们认为,该限制的一部分是由于LLM中缺乏适当的3D时空记忆建模所致 ...

0 0 0 0 2025/07/08 arXiv:2505.22657v1 ZhangML

尽管在各个领域取得了广泛的成功,但即使考虑到3D与3D相关的电感偏差(如翻译不变性和旋转式率),也考虑到3D原子图域(例如分子)的域(例如分子)的跨数据集的表现良好。在本文中,我们证明了 Transformer 可以很好地概括为3D原子图和当前的Equibormer,这是一个图形神经网络利用 Transformer 体系结构的强度,并结合了基于不可征服(IRREPS)的SE(3)/E(3)/E(3) - 等级特征。首先,我们仅通过用量量的产品替换了变形金刚中的原始操作,提出了一种简单有效的体系结构 ...

0 0 0 0 2025/07/08 arXiv:2206.11990v2 wmf

多代理协作通过在多个连接的代理之间启用信息共享来增强自动驾驶系统的安全性,可靠性和流动性有很大的希望。但是,现有的多代理通信方法受到现有通信媒体的局限性的阻碍,包括高带宽需求,代理异质性和信息丢失。为了应对这些挑战,我们介绍了Langcoop,这是一种用于协作自主驾驶的新范式,它利用自然语言作为一种紧凑而表现力的媒介进行跨性别的交流 ...

0 0 0 0 2025/07/08 arXiv:2504.13406v2 15623473941

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)