一译 —— 文档和论文翻译、对照阅读、讨论和社区

CleanVul: Automatic Function-Level Vulnerability Detection in Code Commits Using LLM Heuristics

精确识别软件漏洞对于系统完整性至关重要。通常来自国家漏洞数据库（NVD）或直接来自GitHub的漏洞数据集对于训练机器学习模型以检测这些安全缺陷至关重要。但是，这些数据集经常遭受巨大的噪音，通常是40％至75％，这主要是由于与脆弱性相关的脆弱性固定提交（VFC）的所有变化的自动和不加区分的标记 ...

0 0 0 2025/04/29 arXiv:2411.17274v5 puppytag

CASTLE: Benchmarking Dataset for Static Code Analyzers and LLMs towards CWE Detection

识别源代码中的漏洞至关重要，尤其是在关键软件组件中。现有的方法，例如静态分析，动态分析，正式验证和最近的大语言模型，被广泛用于检测安全缺陷。本文介绍了城堡（CWE自动安全测试和低级评估），这是评估不同方法的漏洞检测功能的基准测试框架 ...

0 0 0 2025/04/29 arXiv:2503.09433v2 puppytag

BigO(Bench) -- Can LLMs Generate Code with Controlled Time and Space Complexity?

我们介绍了Bigo（Bench），这是一种新颖的编码基准测试，旨在评估生成语言模型在理解和生成具有指定时间和空间复杂性的代码方面的功能。该基准测定了当前评估中的差距，这些差距通常忽略了模型理解和产生受计算复杂性约束的代码的能力。 Bigo（台）包括通过分析测量值（包括人类或LLM生成的溶液）来推断任何Python功能的算法复杂性的工具 ...

0 0 0 2025/04/29 arXiv:2503.15242v2 puppytag

AndroidGen: Building an Android Language Agent under Data Scarcity

大型语言模型为各种NLP任务开辟了一个可能性的世界，对未来产生了乐观。尽管有潜力，但LLM尚未被广泛用作实际移动设备的代理。主要的挑战是需要高质量的数据源 ...

0 0 0 2025/04/29 arXiv:2504.19298v1 xjx0524

The Definitive Guide to Policy Gradients in Deep Reinforcement Learning: Theory, Algorithms and Implementations

近年来，在深入的强化学习中提出了各种强大的政策梯度算法。尽管所有这些算法都建立在策略梯度定理的基础上，但特定的设计选择在各算法中都有很大差异。我们提供了对政策政策梯度算法的整体概述，以促进对其理论基础及其实际实施的理解 ...

0 0 0 2025/04/29 arXiv:2401.13662v2 eatme

DSPO: An End-to-End Framework for Direct Sorted Portfolio Construction

在定量投资中，构建特征性的投资组合是资产分配的关键策略。传统方法将不同频率的原始库存数据转化为资产分类的预测特征因素，通常需要进行大量的手动设计和预测目标之间的错位。为了应对这些挑战，我们引入了直接排序的投资组合优化（DSPO），这是一种创新的端到端框架，可有效地处理原始库存数据以直接构建排序的投资组合 ...

0 0 1 2025/04/29 arXiv:2405.15833v1 nnstake

Skywork R1V2: Multimodal Hybrid Reinforcement Learning for Reasoning

我们提出了Skywork R1V2，这是一种下一代多模式推理模型，并从其前身Skywork R1V出发。 R1V2以其核心引入了混合增强学习范式，该学习范式共同利用混合优先优化（MPO）和小组相对政策优化（GRPO），该范围将奖励模式指导与基于规则的策略进行协调，从而解决了平衡与广泛的一般性总体化的长期挑战。为了进一步提高训练效率，我们引入了选择性样品缓冲液（SSB）机制，该机制有效地反驳了GRP ...

0 0 0 2025/04/29 arXiv:2504.16656v2 xueyoo

Multi-source Domain Adaptation in the Deep Learning Era: A Systematic Survey

在许多实际应用中，获得足够的大规模标记数据来训练深层神经网络以达到其全部能力通常很困难和昂贵。因此，将学习的知识从单独的，标记的源域转移到未标记或稀疏标记的目标域成为一种吸引人的选择。但是，直接转移通常会导致由于域移动而导致巨大的性能衰减 ...

0 0 0 2025/04/29 arXiv:2002.12169v1 15966829631

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）