一译 —— 文档和论文翻译、对照阅读、讨论和社区

Adversarially Learned Anomaly Detection

异常检测是一个重大的，因此是一个充分研究的问题。但是，为复杂和高维数据开发有效的异常检测方法仍然是一个挑战。由于生成对抗网络（GAN）能够对现实数据的复杂高维分布进行建模，因此他们提供了一种有希望的方法来应对这一挑战 ...

0 0 0 2025/09/30 arXiv:1812.02288v1 LiuAobin

SEEA-R1: Tree-Structured Reinforcement Fine-Tuning for Self-Evolving Embodied Agents

自我进化，代理人自主改善其推理和行为的能力，对于具有长远的现实世界任务的体现领域至关重要。尽管目前在增强微调（RFT）方面表现出强大的性能在增强LLMS的推理方面的表现，但其具有多模式相互作用的自我发展的体现智能的潜力仍然很大程度上尚未得到探索。具体而言，强化微调在具体设置中面临两个基本障碍：（i）在多步推理任务中缺乏可访问的中间奖励限制了有效的学习信号，以及（ii）对手工制作的奖励功能的依赖将通 ...

0 0 2 2025/09/30 arXiv:2506.21669v1 WuYP

Robust Scene Change Detection Using Visual Foundation Models and Cross-Attention Mechanisms

我们提出了一种新颖的场景变化检测方法，该方法利用了视觉基础模型（Dinov2）的可靠特征提取功能，并整合了全图像跨注意事项，以应对关键挑战，例如不同的照明，季节性变化和视图差异。为了有效地学习用于更改检测任务的图像对之间的对应关系和错误对应，我们建议a）``冻结''骨架，以保留密集的基础特征的一般性，b）采用``full-image'''``full-image''''''''交叉注意，以更好地解 ...

0 0 0 2025/09/30 arXiv:2409.16850v3 ppbc

Refining Salience-Aware Sparse Fine-Tuning Strategies for Language Models

参数有效的微调（PEFT）通过诸如洛拉（Lora）等低级适应方法获得了突出。在本文中，我们专注于基于稀疏性的PEFT（SPEFT），该PEFT（SPEFT）引入了对模型中的重量矩阵的可训练稀疏适应，与低级别方法相比，选择了更大的灵活性。我们对SPEFT的显着性指标进行了首次系统评估，受到零成本NAS代理的启发，并且识别基于梯度的简单指标是可靠的，结果与最佳替代方案相当，提供了计算效率和稳健的性能  ...

0 0 0 2025/09/30 arXiv:2412.13488v2 youkbok

VideoFrom3D: 3D Scene Video Generation via Complementary Image and Video Diffusion Models

在本文中，我们提出了Videofrom3D，这是一个新颖的框架，用于合成粗糙几何，摄像机轨迹和参考图像的高质量3D场景视频。我们的方法简化了3D图形设计工作流程，从而可以灵活设计探索并快速生产可交付成果。从粗几何形状中综合视频的直接方法可能会使视频扩散模型在几何结构上 ...

0 0 0 2025/09/30 arXiv:2509.17985v1 quziyan

AI4Research: A Survey of Artificial Intelligence for Scientific Research

人工智能（AI）的最新进展，特别是在大型语言模型（例如OpenAI-O1和DeepSeek-R1）中，在复杂领域（例如逻辑推理和实验编码）中表现出了显着的功能。在这些进步的推动下，许多研究探讨了AI在创新过程中的应用，特别是在科学研究的背景下。这些AI技术主要旨在开发可以自主在广泛的科学学科进行研究过程的系统 ...

0 0 0 2025/09/30 arXiv:2507.01903v2 18028729692

SkillMimic-V2: Learning Robust and Generalizable Interaction Skills from Sparse and Noisy Demonstrations

我们解决了从相互作用演示中学习（RLID）的强化学习的基本挑战：演示噪声和覆盖范围限制。尽管现有的数据收集方法提供了有价值的互动演示，但它们通常会产生稀疏，断开和嘈杂的轨迹，这些轨迹无法捕获可能的技能变化和过渡。我们的关键见解是，尽管进行了嘈杂且稀疏的示范，但存在着无限的物理可行轨迹，这些轨迹自然地在邻近的状态中桥接了示威的技能或从其邻国出现，形成了可能的技能变化和过渡的连续空间 ...

0 1 0 2025/09/29 arXiv:2505.02094v1 ziyanhuang

CrossPipe: Towards Optimal Pipeline Schedules for Cross-Datacenter Training

培训大语言模型（LLMS）现在需要超过单个数据中心的资源，这使得交叉策略越来越重要。我们提出了CrossPipe，该框架旨在通过明确建模和减轻网络潜伏期和有限的带宽的影响来优化地理分布式数据中心的模型培训。它实现了统一的分析和优化，包括管道并行性（PP）和重叠数据并行性（DP）通信的机会 ...

0 0 0 2025/09/29 arXiv:2507.00217v1 liangliangliang

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）