一译 —— 文档和论文翻译、对照阅读、讨论和社区

Curiosity-Diffuser: Curiosity Guide Diffusion Models for Reliability

机器人智能中的瓶颈之一是神经网络模型的不稳定性，与控制模型不同，该模型缺乏定义明确的收敛域和稳定性。在物理世界中应用智能时，这会导致风险。具体而言，基于神经网络的模仿政策可能会产生幻觉，从而导致行为不准确，从而影响现实世界应用的安全性 ...

0 0 0 2025/04/16 arXiv:2503.14833v1 jesson

Enhancing the Robustness of LLM-Generated Code: Empirical Study and Framework

确保大语模型（LLM）生成的代码的鲁棒性对于现实世界的可靠性至关重要。但是，现有评估主要集中在正确性上，通常会忽略关键的鲁棒性问题，例如丢失输入验证和错误处理不足。在本文中，我们介绍了有关LLM生成代码鲁棒性的首次实证研究 ...

0 0 0 2025/04/16 arXiv:2503.20197v2 15966829631

FlowKV: A Disaggregated Inference Framework with Low-Latency KV Cache Transfer and Load-Aware Scheduling

分解推理已成为一个必不可少的框架，该框架将大型语言模型推理中的预填充（p）和解码（d）阶段分开以改善吞吐量。但是，KV缓存传输面对预填充和解码节点之间的显着延迟。块呼叫方法和不连续的KV缓存内存分配增加了对传输内核的调用数量 ...

0 1 0 2025/04/16 arXiv:2504.03775v1 tea5

Against The Achilles' Heel: A Survey on Red Teaming for Generative Models

生成模型迅速普及并被集成到日常应用中，随着各种漏洞的暴露，引发了人们对其安全问题的担忧。面对这个问题，红队领域正在经历快速增长，这凸显了需要一个覆盖整个管道并解决社区新兴主题的综合组织。我们进行了广泛的调查，审查了 120 多篇论文，引入了基于语言模型固有功能的细粒度攻击策略的分类 ...

0 0 0 2025/04/16 arXiv:2404.00629v2 byron_

ConRFT: A Reinforced Fine-tuning Method for VLA Models via Consistency Policy

视觉语言动作（VLA）模型在实际机器人操作中显示出很大的潜力。但是，由于有限，不一致的示威，尤其是在接触良好的环境中，通过监督学习斗争来微调这些模型，以实现稳健的表现。在本文中，我们为VLA模型提出了一种加强的微调方法，该模型名为ConRft，该方法由离线和在线微调组成，并具有基于统一的一致性培训目标，以应对这些挑战 ...

0 0 0 2025/04/16 arXiv:2502.05450v2 晚餐杀手

A comprehensive and fair comparison of two neural operators (with practical extensions) based on FAIR data

神经操作员可以在功能空间之间学习非线性映射，并提供新的模拟范式，以实时预测现实的多样化应用以及科学和工程中的系统识别。在此，我们研究了两个神经操作员的性能，并开发了新的实用扩展，这将使它们更加准确，健壮，并且重要的是更适合工业复杂性应用。第一个神经操作员DeepOnet于2019年出版，第二个名为Fourier Neural Operator或FNO的神经操作员于2020年出版 ...

0 0 0 2025/04/16 arXiv:2111.05512v1 wgkooo

MIEB: Massive Image Embedding Benchmark

图像表示通常是通过脱节的，特定于任务的协议来评估的，从而导致对模型功能的理解分散。例如，目前尚不清楚嵌入模型的图像是否熟悉聚类图像是否同样擅长检索一段文本的相关图像。我们介绍了庞大的图像嵌入基准（MIEB），以评估迄今为止最广泛的范围内图像和图像式嵌入模型的性能 ...

0 0 0 2025/04/16 arXiv:2504.10471v1 lifeicheng

LLMs for User Interest Exploration in Large-scale Recommendation Systems

传统的推荐系统通过学习和强化过去的用户-项目交互而受到强大的反馈循环的影响，这反过来又限制了新的用户兴趣的发现。为了解决这个问题，我们引入了一种混合分层框架，llm）和用于用户兴趣探索的经典推荐模型。该框架通过“兴趣簇”控制llm和经典推荐模型之间的接口，其粒度可以由算法设计者明确确定... ...

0 0 0 2025/04/16 arXiv:2405.16363v2 fifol

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）