暗物质可以由宏观物体组成,这些物体具有较大的质量和几十年的几何横截面。我们通过考虑其与小行星,行星环和陆地物体的相互作用,研究了这种“材料大小”暗物质的潜在相互作用。这种暗物质的冰雹可能会灾难性地破坏这些太阳系物体,从轨道上蒸发,或引起大量的碎屑 ...
0 0 0 2025/04/13 arXiv:2504.07232v1 mmmp
培训有效的AI代理进行多转交互作用需要高质量的数据,以捕获现实的人类代理动力学,但是手动收集的数据却很少且昂贵。我们介绍了Apigen-MT,这是一个两阶段的框架,生成可验证和多样化的多转变代理数据。在第一阶段,我们的代理管道通过基本操作产生详细的任务蓝图,利用LLM审阅者委员会和迭代反馈循环 ...
0 0 0 2025/04/13 arXiv:2504.03601v2 chrisxiong
在本文中,我们提出了场景飞溅,这是一种基于动量的范式,用于视频扩散,以从单个图像中生成通用场景。现有的方法采用视频生成模型来综合新观点,遭受视频长度和场景不一致的有限,导致在进一步重建过程中导致伪影和扭曲。为了解决这个问题,我们构建了来自原始功能的嘈杂样本作为增强视频细节并保持场景一致性的动量 ...
0 0 0 2025/04/13 arXiv:2504.02764v1 19303025040
多模式情感分析(MSA)利用多模式数据来推断用户的情感。先前的方法着重于平等地对待每种方式或静态上使用文本作为进行互动的主要方式的贡献,这忽略了每种方式可能成为主导的情况。在本文中,我们提出了一种知识引导的动态情感注意融合框架(KUDA),以进行多模式情感分析 ...
0 0 0 2025/04/13 arXiv:2410.04491v1 huyang
本文介绍了多模式检索仪(M^2RAG),这是一种基准测试,旨在评估多模式大语言模型(MLLMS)在利用多模式检索文档的知识中的有效性。基准标准包括四个任务:图像字幕,多模式问答,多模式的事实验证和图像重新管理。所有任务均在开放域设置中设置,需要从多模式文档收集中检索与查询相关的信息,并将其用作抹布建模的输入上下文 ...
0 0 0 2025/04/13 arXiv:2502.17297v1 hynj
个性化的自然语言生成可解释的建议在证明为什么建议可能与用户的兴趣相匹配的原因中起着关键作用。现有模型通常通过方面计划控制发电过程。在有希望的同时,这些方面计划的方法难以正确地生成特定的信息,从而阻止产生的解释令人信服 ...
0 0 0 2025/04/13 arXiv:2209.13885v2 就爱看论文
可控的3D场景生成在虚拟现实和室内设计中具有广泛的应用,在该设计中,生成的场景应在几何形状方面表现出很高的现实主义和可控性。场景图提供了合适的数据表示,以促进这些应用程序。但是,当前基于图的场景生成方法限制在基于文本的输入中,并且对灵活的用户输入的适应性不足,从而阻碍了精确控制对象几何形状的能力 ...
0 0 0 2025/04/13 arXiv:2502.05874v3 19303025040
我们建议使用在大规模监督视频数据集中训练的深层三维卷积网络(3D Convnets),为时空特征学习提供了一种简单但有效的方法。我们的发现是三个方面的:1)3D Convnets与2D Convnets相比,更适合时空特征学习; 2)在所有层中具有小3x3x3卷积内核的同质建筑是3D Convnets的最佳性能架构之一; 3)我们学到的功能,即C3D(卷积3D),具有简单的线性分类器在4种不同的基 ...
0 0 0 2025/04/13 arXiv:1412.0767v4 nameLZM

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)