一译 —— 文档和论文翻译、对照阅读、讨论和社区

Text to Image Generation and Editing: A Survey

文本到图像生成（T2I）是指高质量图像的文本引导产生。在过去的几年中，T2I引起了广泛的关注，并且出现了许多作品。在这项调查中，我们全面审查了2021年至2024年进行的141件作品 ...

0 0 0 2025/05/07 arXiv:2505.02527v1 ReLU

MeshA*: Efficient Path Planing With Motion Primitives

我们研究了一个路径计划问题，其中可能的移动动作被表示为与环境的网格表示相一致的有限运动原语。也就是说，每个原始词都对应于药物的短动力学运动运动，并表示为网格的扫掠细胞的序列。通常，启发式搜索，我 ...

0 0 0 2025/05/07 arXiv:2412.10320v1 wang12

Timestep Embedding Tells: It's Time to Cache for Video Diffusion Model

作为视频生成的基本支柱，扩散模型由于去噪的顺序性质而受到推理速度低的挑战。以前的方法通过以统一选择的时间步长缓存和重用模型输出来加速模型。然而，这种策略忽略了模型输出之间的差异在时间步上不均匀的事实，这阻碍了选择合适的模型输出进行缓存，导致推理效率和视觉质量之间的平衡不佳 ...

0 0 0 2025/05/07 arXiv:2411.19108v2 daoxian

AgentOccam: A Simple Yet Strong Baseline for LLM-Based Web Agents

使用大语言模型（LLM）进行个性化，标准化任务的自主权提高了人类效率。自动化网络任务（例如在预算内预订酒店）越来越受到追捧。满足实际需求，Web代理也是各种代理接地方案的重要概念验证示例，并在许多未来的应用程序中都取得了成功的进步 ...

0 0 1 2025/05/07 arXiv:2410.13825v1 panda__

PlanGenLLMs: A Modern Survey of LLM Planning Capabilities

LLM具有生成计划的巨大潜力，将最初的世界国家转变为期望的目标状态。大量研究探索了LLM在各种计划任务中的使用，从网络导航到旅行计划和数据库查询。但是，其中许多系统是针对特定问题量身定制的，因此将它们进行比较或确定新任务的最佳方法具有挑战性 ...

0 0 0 2025/05/07 arXiv:2502.11221v1 Kazeya

TWIST: Teleoperated Whole-Body Imitation System

以全身方式对类人生物机器人进行远程操作，这标志着发展通用机器人智能的基本步骤，人类运动为控制所有自由程度提供了理想的界面。然而，大多数当前的类人动物远距离系统无法实现协调的全身行为，通常将自己限制在孤立的运动或操纵任务上。我们介绍了通过全身运动模仿的人形动物近视系统的远程工作全身模仿系统（Twist） ...

0 1 1 2025/05/07 arXiv:2505.02833v1 晚餐杀手

Frequency Dynamic Convolution for Dense Image Prediction

虽然动态卷积（DY-CONV）通过通过多个平行重量与注意机制相结合的自适应重量选择来表现出令人鼓舞的性能，但这些权重的频率响应往往表现出很高的相似性，从而导致高参数成本，但适应性有限。在这项工作中，我们引入了频率动态卷积（FDCONV），这是一种新颖的方法，通过在傅立叶域中学习固定参数预算来减轻这些局限性。 FDCONV将该预算分为具有频率傅立叶指数的基于频率的组，从而在不增加参数成本的情况下构建 ...

0 0 0 2025/05/07 arXiv:2503.18783v2 澹台心木

Financial Knowledge Large Language Model

人工智能在金融行业取得了长足的进步，彻底改变了数据的处理和解释。在这些技术中，大型语言模型（LLMS）通过自动化复杂的任务，增强客户服务并提供详细的财务分析来证明转型金融服务的巨大潜力。首先，我们介绍了Idea-Finbench，这是一种评估基准，专门针对评估大语模型（LLMS）中的财务知识的量身定制 ...

0 0 0 2025/05/07 arXiv:2407.00365v1 7788

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）