一译 —— 文档和论文翻译、对照阅读、讨论和社区

Localizing and Mitigating Errors in Long-form Question Answering

长形的问题回答（LFQA）旨在为复杂问题提供详尽而深入的答案，从而增强理解。但是，这种详细的回应容易出现幻觉和事实矛盾，从而挑战了他们忠实的评估。这项工作介绍了Haluquestqa，这是第一个具有局部错误注释的幻觉数据集，该数据集可用于人体编写和模型生成的LFQA答案 ...

0 0 0 2025/05/23 arXiv:2407.11930v4 leec

CASS: Nvidia to AMD Transpilation with Data, Models, and Benchmark

我们介绍了\ texttt {cass}，这是第一个用于跨架构GPU代码转移的大型数据集和模型套件，针对源级别（CUDA〜 $ \ leftrightArrow $ 〜HIP）和汇编级别和汇编级别（NVIDIA SASS〜 $ \ leftrightrightarrow $ 〜Amdna3）。该数据集包括跨主机和设备的70K验证的代码对，解决了低级GPU代码可移植性中的关键差距。利用此资源，我们训 ...

0 0 0 2025/05/23 arXiv:2505.16968v1 jane88

Distinguishing Look-Alike Innocent and Vulnerable Code by Subtle Semantic Representation Learning and Explanation

尽管已经提出了许多基于深度学习（DL）的漏洞检测方法，并且确实取得了显着的性能，但它们在概括和实际用法中仍然存在局限性。更确切地说，现有的基于DL的方法（1）对词汇相似但具有相反语义的功能之间的预测任务进行负面影响； （2）没有为检测结果提供直观的开发者解释。在本文中，我们提出了一种名为Svuld的新方法，该方法是一种功能级的微妙的语义嵌入，以漏洞检测以及直观的解释，以减轻上述局限性 ...

0 0 0 2025/05/23 arXiv:2308.11237v1 dkf

Extreme Parkour with Legged Robots

人类可以通过以高度动态的方式穿越障碍来进行跑酷，需要精确的眼部肌肉协调和运动。让机器人执行相同的任务需要克服类似的挑战。从经典上讲，这是通过独立工程的感知，驱动和控制系统来完成的 ...

0 0 0 2025/05/23 arXiv:2309.14341v1 yydsdsyy

An Empirical Evaluation of Columnar Storage Formats

柱状存储是现代数据分析系统的核心组成部分。尽管许多数据库管理系统（DBMS）具有专有的存储格式，但大多数数据库管理系统为开源存储格式（例如Parquet和Orc）提供了广泛的支持，以促进跨平台数据共享。但是这些格式是十年前的2010年代初期为Hadoop生态系统开发的 ...

0 0 0 2025/05/23 arXiv:2304.05028v3 李大人

Improving Generalization in Intent Detection: GRPO with Reward-Based Curriculum Sampling

意图检测是以任务为导向对话（TOD）系统中的关键组成部分，在适应具有复杂相互关系的可集成工具的快速涌入时面临重大挑战。现有的方法，例如零拍摄的重新纠正和基于LLM的动态识别，在遇到看不见的意图时会与性能退化斗争，从而导致错误的任务路由。为了增强模型在看不见的任务上的概括性能，我们采用了强化学习（RL），并在小组相对策略优化（GRPO）培训期间结合了基于奖励的课程抽样（RC） ...

0 0 0 2025/05/23 arXiv:2504.13592v2 siweima

A survey of joint intent detection and slot-filling models in natural language understanding

意图分类和槽填充是自然语言理解的两个关键任务。传统上，这两项任务被认为是独立进行的。然而，最近，意图分类和槽填充的联合模型已经实现了最先进的性能，并证明这两个任务之间存在很强的关系... ...

0 0 0 2025/05/23 arXiv:2101.08091v3 Shmily

FilmComposer: LLM-Driven Music Production for Silent Film Clips

在这项工作中，我们使用LLM驱动的方法为无声电影剪辑实施音乐制作。鉴于电影音乐制作的专业要求很强，我们提出了电影节目，模拟了专业音乐家的实际工作流程。 FilmComposer是第一个将大型生成模型与多代理方法相结合的人，利用了波形音乐和象征性音乐发电的优势 ...

0 0 0 2025/05/23 arXiv:2503.08147v1 瓶子

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）