一译 —— 文档和论文翻译、对照阅读、讨论和社区

STRIDE: Automating Reward Design, Deep Reinforcement Learning Training and Feedback Optimization in Humanoid Robotics Locomotion

人形机器人在人工智能中提出了重大挑战，需要精确的协调和控制高度自由系统的系统。为该领域中的深入增强学习（DRL）设计有效的奖励功能仍然是一个关键的瓶颈，要求大量的手动努力，域专业知识和迭代精致。为了克服这些挑战，我们引入了大步，这是一个建立在代理工程上的新颖框架，以自动化奖励设计，DRL培训和针对人形机器人机器人运动任务的反馈优化 ...

0 0 0 2025/03/03 arXiv:2502.04692v3 kate2024

Target before Shooting: Accurate Anomaly Detection and Localization under One Millisecond via Cascade Patch Retrieval

在这项工作中，通过重新审查异常检测的“匹配”性质（AD），我们提出了一个新的广告框架，同时享受广告准确性的新记录，并且跑步速度很高。在此框架中，通过级联贴片检索程序解决了异常检测问题，该过程以粗到精细的方式检索每个测试图像贴片的最接近的邻居。在给定测试样本的情况下，首先基于强大的直方图匹配过程首先选择了最相似的训练图像 ...

0 0 0 2025/03/03 arXiv:2308.06748v1 zhh2411

FedDyMem: Efficient Federated Learning with Dynamic Memory and Memory-Reduce for Unsupervised Image Anomaly Detection

无监督的图像异常检测（UAD）已成为工业和医疗应用中的关键过程，但是由于对数据隐私的担忧日益关注，它面临着越来越多的挑战。一级分类任务固有的有限类多样性，再加上由客户内部和客户内部产品的变化引起的分配偏见，对通过Federated UAD保存数据隐私提出了重大挑战。因此，本文提出了一种有效的联合学习方法，具有动态记忆和记忆 - 无监督图像异常检测，称为FedDymem ...

0 0 0 2025/03/03 arXiv:2502.21012v1 link.yu

DiaHalu: A Dialogue-level Hallucination Evaluation Benchmark for Large Language Models

由于近年来大型语言模型（LLM）取得了重大成功，因此幻觉问题仍然是一个挑战，因此提出了许多基准来检测幻觉。然而，其中一些基准不是由LLM自然产生的，而是故意诱导的。同样，许多人仅关注事实幻觉，同时忽略忠实的幻觉 ...

0 0 0 2025/03/03 arXiv:2403.00896v3 18232448525

Learning to Plan for Retrieval-Augmented Large Language Models from Knowledge Graphs

提高大型语言模型（LLM）在复杂问答（QA）场景中的性能一直是研究重点。最近的研究试图通过将逐步规划与外部检索相结合来提高 LLM 的表现。同时对于 GPT-3 等高级模型有效 ...

0 1 0 2025/03/03 arXiv:2406.14282v3 honghong

Stream Aligner: Efficient Sentence-Level Alignment via Distribution Induction

大型语言模型（LLM）的快速发展导致其能力的显着提高，同时也增加了人们对人类价值观和意图的一致性的关注。当前的一致性策略，包括自适应训练和推理时间方法，在这一领域表现出了潜力。但是，这些方法仍然很难平衡各种任务和困难的部署复杂性和能力 ...

0 0 0 2025/03/03 arXiv:2501.05336v1 changer32

Hard Prompts Made Interpretable: Sparse Entropy Regularization for Prompt Tuning with RL

随着基础模型的出现，迅速的调整已将自己定位为指导模型行为和引起所需响应的重要技术。提示调查为输入中的选择适当的关键字选择，从而在不调整或微调模型参数的情况下适应下游任务。从直接利用从模型的反向传播的梯度信号到采用黑盒优化的方法，例如加固学习（RL）方法的方法，迅速调整的工作范围很广 ...

0 0 0 2025/03/03 arXiv:2407.14733v1 mgk001

Modeling Dynamic Attributes for Next Basket Recommendation

下一个项目和下一个篮子建议的传统方法通常会根据其过去的交互和相关的静态上下文信息（例如用户ID或项目类别）提取用户的兴趣 ...

0 0 0 2025/03/03 arXiv:2109.11654v1 milimiko

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）