一译 —— 文档和论文翻译、对照阅读、讨论和社区

Attentional Feature Fusion

特征融合（来自不同层或分支的特征的组合）是现代网络体系结构的无所不在的一部分。它通常是通过简单操作（例如求和或串联）实现的，但这可能不是最佳选择。在这项工作中，我们提出了一个统一和一般的方案，即注意特征融合，该方案适用于大多数常见的情况，包括由短和长跳连接以及在开始层内引起的特征融合 ...

0 0 0 2025/05/12 arXiv:2009.14082v2 SGN001

InterMimic: Towards Universal Whole-Body Control for Physics-Based Human-Object Interactions

长期以来，实现与各种物体互动的人类互动的现实模拟一直是一个基本目标。由于复杂的人类对象耦合，对象几何形状的可变性以及运动捕获数据中的伪像，因此将基于物理的运动模仿扩展到复杂的人类对象相互作用（HOI）是具有挑战性的，例如不准确的接触和有限的手部细节。我们介绍了Intermimic，该框架使单个策略能够从不完美的MOCAP数据中鲁棒性地学习，涵盖了与动态和多样化对象的多元化相互作用 ...

0 0 0 2025/05/12 arXiv:2502.20390v1 ZhaoJiance

Large Language Model Enhanced Recommender Systems: A Survey

大型语言模型 (LLM) 在各个领域都具有变革潜力，包括推荐系统 (RS)。有一些研究专注于通过 LLM 增强RS的能力。然而，之前的努力主要集中在LLM作为RS，这可能面临LLM不容忍推理成本的挑战 ...

0 0 0 2025/05/12 arXiv:2412.13432v3 Lum0s

UnIRe: Unsupervised Instance Decomposition for Dynamic Urban Scene Reconstruction

重建和分解动态的城市场景对于自动驾驶，城市规划和场景编辑至关重要。但是，现有方法无法执行实例感知的分解而没有手动注释，这对于实例级别的场景至关重要。该HTTP URL提出了UNIRE提出的基于3D高斯分裂（3DGS）的方法，该方法将场景分解为静态背景和单个动态实例，仅使用RGB Point和Lidar Point clouds clouds。从本质上讲，我们介绍了4D SuperPoints，这是 ...

0 0 0 2025/05/12 arXiv:2504.00763v1 zhanguanglun

EKT: Exercise-aware Knowledge Tracing for Student Performance Prediction

为了为智能教育的学生提供积极的服务，其中一项基本任务之一是预测他们的表现（例如，得分）在未来的练习中有必要在她的练习活动中跟踪每个学生的知识获取 ...

0 0 0 2025/05/12 arXiv:1906.05658v1 乐乐

RAG-MCP: Mitigating Prompt Bloat in LLM Tool Selection via Retrieval-Augmented Generation

大型语言模型（LLMS）难以有效地利用越来越多的外部工具，例如由于迅速膨胀和选择复杂性，模型上下文协议（MCP）\ cite {介绍{介绍{引入mcp}的工具。我们介绍了RAG-MCP，这是一个检索型生成框架，通过卸载工具发现来克服这一挑战。 RAG-MCP使用语义检索来在参与LLM之前从外部索引中识别给定查询的最相关的MCP ...

0 0 0 2025/05/12 arXiv:2505.03275v1 a154377713

Learnable Activation Functions in Physics-Informed Neural Networks for Solving Partial Differential Equations

我们研究了可学习的激活功能在物理信息的神经网络（PINN）中用于求解部分微分方程（PDES）。具体而言，我们比较了使用可学习的基础功能的Kolmogorov-Arnold网络（KANS），比较了传统多层感知器（MLP）（MLP）的功效。物理知识的神经网络（PINN）已成为将物理定律直接纳入学习过程的有效方法，为与PDE相关的远期和反问题提供了数据效率的解决方案 ...

0 0 0 2025/05/12 arXiv:2411.15111v1 做自己的光

LSNet: See Large, Focus Small

视觉网络设计，包括卷积神经网络和视觉 Transformer ，已大大推进了计算机视觉领域。然而，它们的复杂计算对实际部署构成了挑战，尤其是在实时应用程序中。为了解决这个问题，研究人员探索了各种轻巧，高效的网络设计 ...

0 0 0 2025/05/12 arXiv:2503.23135v1 ttt

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）