一译 —— 文档和论文翻译、对照阅读、讨论和社区

Lifting by Image -- Leveraging Image Cues for Accurate 3D Human Pose Estimation

由于2D姿势估计器的强大视觉分析能力，“从2D姿势的提升”方法是3D人姿势估计（3DHPE）的主要方法。众所周知的是，仅从2D姿势估算时，就会存在一个深度的歧义问题，其中一个2D姿势可以映射到多个3D姿势。图像中丰富的语义和纹理信息在直觉上可能会导致更准确的“提升”程序 ...

0 0 0 2025/07/09 arXiv:2312.15636v1 yanyu

Geometry-Aware Texture Generation for 3D Head Modeling with Artist-driven Control

为与精确的艺术视觉相匹配的虚拟字符创建现实的3D头部资产仍然是劳动密集型。我们提出了一个新颖的框架，该框架通过为艺术家提供对生成的3D头的直观控制来简化这一过程。我们的方法使用了几何学感知的纹理综合管道，该管道了解了不同人口统计学之间的头部几何形状和皮肤纹理图之间的相关性 ...

0 0 0 2025/07/09 arXiv:2505.04387v1 hacetate

S2F2: Self-Supervised High Fidelity Face Reconstruction from Monocular Image

我们提出了一种新型的面部重建方法，能够重建详细的面部几何形状，从单眼图像中从空间变化的面部反射率。我们基于最新的基于DNN的自动编码器的进步，以可不同的射线追踪图像形成，以自我监督的方式训练。在提供基于学习的方法和实时重建的优势的同时，后一种方法缺乏忠诚 ...

0 0 0 2025/07/09 arXiv:2203.07732v2 hacetate

Towards High Fidelity Monocular Face Reconstruction with Rich Reflectance using Self-supervised Learning and Ray Tracing

在一般照明条件下，从单眼图像中重建的稳健面部重建具有挑战性。将深度神经网络编码与可区分渲染相结合的方法为非常快速的几眼重建几何，照明和反射率开辟了道路。他们也可以以自我监督的方式接受培训，以提高鲁棒性和更好的概括 ...

0 0 0 2025/07/09 arXiv:2103.15432v3 hacetate

ReFusion: Learning Image Fusion from Reconstruction with Learnable Loss via Meta-Learning

图像融合旨在将来自多个源图像的信息组合到具有更全面的信息内容的单个图像中。基于深度学习的图像融合算法面临着重大挑战，包括缺乏确定的地面真相和相应的距离测量。此外，当前手动定义的损耗函数限制了模型的灵活性和各种融合任务的概括性 ...

0 0 0 2025/07/09 arXiv:2312.07943v3 123954561121266

Practical Face Reconstruction via Differentiable Ray Tracing

我们提出了一种基于射线追踪的新颖面部重建方法，其中场景属性 -  3D几何，反射率（漫射，镜头和粗糙度），姿势，摄像头参数和场景照明 - 是根据无约束的单眼图像估算的。提出的方法模型通过新颖的，参数化的虚拟光阶段照明，该阶段与可区分的射线追踪进行了结合，引入了面部重建的粗到最新优化公式。我们的方法不仅可以处理无约束的照明和自我阴影条件，还可以估计弥漫性和镜面反照率 ...

0 0 0 2025/07/09 arXiv:2101.05356v1 hacetate

Learning Humanoid Arm Motion via Centroidal Momentum Regularized Multi-Agent Reinforcement Learning

人类在运动过程中自然会挥舞手臂，以调节全身动力学，减少角动量并帮助保持平衡。受这一原则的启发，我们提出了一个肢体级的多代理增强学习（RL）框架，该框架可以通过出现的手臂运动来协调人形机器人的全身控制。我们的方法采用单独的武器和腿部批评者结构，接受了集中批评者的训练，但分散的参与者仅具有基本状态和质心动量（CAM）观察，使每个代理都可以通过模块化的奖励设计专门研究与任务相关的行为 ...

0 0 0 2025/07/09 arXiv:2507.04140v1 yukun

Evaluating Memory in LLM Agents via Incremental Multi-Turn Interactions

大型语言模型（LLM）代理的最新基准主要集中于评估推理，计划和执行功能，而另一个关键的组件记忆，包括由于缺乏基准测试而导致的代理如何记住，更新和检索长期信息不足的信息不足。我们将记忆机制作为内存剂表示。在本文中，我们确定了对记忆代理至关重要的四个核心能力：准确的检索，测试时间学习，远程理解和解决冲突 ...

0 0 0 2025/07/09 arXiv:2507.05257v1 finirush

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）