一译 —— 文档和论文翻译、对照阅读、讨论和社区

AlphaEvolve: A Learning Framework to Discover Novel Alphas in Quantitative Investment

Alpha是股票市场中捕获交易信号的股票预测模型。一组有效的alpha可以产生微弱相关的高回报，以使风险多样化。现有的alpha可以分为两个类：公式化的alpha是标量特征的简单代数表达式，因此可以很好地推广并被挖掘为弱相关的集合 ...

0 0 0 2025/05/27 arXiv:2103.16196v2 leec

Efficient Agent Training for Computer Use

长期以来，扩大高质量的轨迹数据一直是开发类似人类的计算机使用剂的关键瓶颈。我们介绍了PC Agent-E，这是一个有效的代理训练框架，可显着降低对大型人类示范的依赖。从仅312个人类注销的计算机使用轨迹开始，我们通过用Claude 3合成各种动作决策进一步提高了数据质量 ...

0 0 0 2025/05/27 arXiv:2505.13909v1 leec

Pangu Light: Weight Re-Initialization for Pruning and Accelerating LLMs

大型语言模型（LLMS）在许多任务中提供了最先进的功能，但是它们的巨大规模和推理成本对实际部署构成了重大的计算挑战。尽管结构化的修剪为模型压缩提供了有希望的途径，但现有方法通常会在侵略性，同时宽度和深度降低的有害影响方面遇到困难，从而导致大量的性能退化。本文认为，使这种积极的联合修剪可行的关键，经常被忽视的方面是战略性的重新定位和剩余权重调整以改善模型后的固定后培训精确度 ...

0 0 0 2025/05/27 arXiv:2505.20155v1 garming

Generative Large Recommendation Models: Emerging Trends in LLMs for Recommendation

在信息过载的时代，推荐系统在过滤数据和提供个性化内容方面起着关键作用。功能交互和用户行为建模方面的最新进展显着增强了这些系统的回忆和排名过程。随着大语言模型（LLM）的兴起，已经出现了新的机会，以进一步改善推荐系统 ...

0 0 0 2025/05/27 arXiv:2502.13783v1 sadbb

MoE Jetpack: From Dense Checkpoints to Adaptive Mixture of Experts for Vision Tasks

专家（MOE）模型的稀疏激活混合物为传统密集激活（致密）模型提供了有希望的替代品，从而提高了质量和计算效率。但是，从头开始培训MOE模型需要大量的数据和计算资源。此外，像蒂姆（Timm）这样的公共存储库主要提供预先训练的密集检查站，缺乏类似的MOE模型资源，从而阻碍了其采用 ...

0 0 0 2025/05/27 arXiv:2406.04801v1 jingxi

DMind Benchmark: Toward a Holistic Assessment of LLM Capabilities across the Web3 Domain

大型语言模型（LLM）在各种自然语言处理任务中取得了令人印象深刻的表现，但是诸如Web3之类的专业领域提出了新的挑战，并且需要更量身定制的评估。尽管Web3中有重要的用户基础和资本流量，但包括智能合约，分散融资（DEFI），无遗体 Token （NFTS），分散的自治组织（DAOS），链政府和新型的 Token 经济学，没有全面的基准在此Domain中进行系统评估。为了解决这一差距，我们介绍了DM ...

0 0 0 2025/05/27 arXiv:2504.16116v2 啦啦不是一棵菠菜

Task Attribute Distance for Few-Shot Learning: Theoretical Analysis and Applications

很少有射击学习（FSL）旨在通过利用\ emph {相关}培训任务的经验来学习很少的标签样本。在本文中，我们试图通过研究两个关键问题来理解FSL：（1）如何量化\ emph {triending}和\ emph {news}任务之间的关系？ （2）这种关系如何影响不同模型的新任务的\ emph {适应困难}？为了回答这两个问题，我们介绍了以属性为指标的任务属性距离（TAD），以量化任务相关性。与许 ...

0 0 0 2025/05/27 arXiv:2403.03535v1 leec

Scaling Reasoning, Losing Control: Evaluating Instruction Following in Large Reasoning Models

指导跟踪对于将大语言模型（LLM）与用户意图保持一致至关重要。尽管最近以推理为导向的模型在复杂的数学问题上表现出令人印象深刻的表现，但它们遵守自然语言指令的能力仍然没有得到充实的态度。在这项工作中，我们介绍了Mathif，这是一种专门的基准测试，用于评估数学推理任务中的指导跟踪 ...

0 0 0 2025/05/27 arXiv:2505.14810v2 leec

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）