特征融合(来自不同层或分支的特征的组合)是现代网络体系结构的无所不在的一部分。它通常是通过简单操作(例如求和或串联)实现的,但这可能不是最佳选择。在这项工作中,我们提出了一个统一和一般的方案,即注意特征融合,该方案适用于大多数常见的情况,包括由短和长跳连接以及在开始层内引起的特征融合 ...
0 0 0 2025/05/12 arXiv:2009.14082v2 SGN001
长期以来,实现与各种物体互动的人类互动的现实模拟一直是一个基本目标。由于复杂的人类对象耦合,对象几何形状的可变性以及运动捕获数据中的伪像,因此将基于物理的运动模仿扩展到复杂的人类对象相互作用(HOI)是具有挑战性的,例如不准确的接触和有限的手部细节。我们介绍了Intermimic,该框架使单个策略能够从不完美的MOCAP数据中鲁棒性地学习,涵盖了与动态和多样化对象的多元化相互作用 ...
0 0 0 2025/05/12 arXiv:2502.20390v1 ZhaoJiance
大型语言模型 (LLM) 在各个领域都具有变革潜力,包括推荐系统 (RS)。有一些研究专注于通过 LLM 增强RS的能力。然而,之前的努力主要集中在LLM作为RS,这可能面临LLM不容忍推理成本的挑战 ...
0 0 0 2025/05/12 arXiv:2412.13432v3 Lum0s
重建和分解动态的城市场景对于自动驾驶,城市规划和场景编辑至关重要。但是,现有方法无法执行实例感知的分解而没有手动注释,这对于实例级别的场景至关重要。该HTTP URL提出了UNIRE提出的基于3D高斯分裂(3DGS)的方法,该方法将场景分解为静态背景和单个动态实例,仅使用RGB Point和Lidar Point clouds clouds。从本质上讲,我们介绍了4D SuperPoints,这是 ...
0 0 0 2025/05/12 arXiv:2504.00763v1 zhanguanglun
为了为智能教育的学生提供积极的服务,其中一项基本任务之一是预测他们的表现(例如,得分)在未来的练习中有必要在她的练习活动中跟踪每个学生的知识获取 ...
0 0 0 2025/05/12 arXiv:1906.05658v1 乐乐
大型语言模型(LLMS)难以有效地利用越来越多的外部工具,例如由于迅速膨胀和选择复杂性,模型上下文协议(MCP)\ cite {介绍{介绍{引入mcp}的工具。我们介绍了RAG-MCP,这是一个检索型生成框架,通过卸载工具发现来克服这一挑战。 RAG-MCP使用语义检索来在参与LLM之前从外部索引中识别给定查询的最相关的MCP ...
0 0 0 2025/05/12 arXiv:2505.03275v1 a154377713
我们研究了可学习的激活功能在物理信息的神经网络(PINN)中用于求解部分微分方程(PDES)。具体而言,我们比较了使用可学习的基础功能的Kolmogorov-Arnold网络(KANS),比较了传统多层感知器(MLP)(MLP)的功效。物理知识的神经网络(PINN)已成为将物理定律直接纳入学习过程的有效方法,为与PDE相关的远期和反问题提供了数据效率的解决方案 ...
0 0 0 2025/05/12 arXiv:2411.15111v1 做自己的光
视觉网络设计,包括卷积神经网络和视觉 Transformer ,已大大推进了计算机视觉领域。然而,它们的复杂计算对实际部署构成了挑战,尤其是在实时应用程序中。为了解决这个问题,研究人员探索了各种轻巧,高效的网络设计 ...
0 0 0 2025/05/12 arXiv:2503.23135v1 ttt

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)