一译 —— 文档和论文翻译、对照阅读、讨论和社区

AlphaEvolve: A coding agent for scientific and algorithmic discovery

在这份白皮书中，我们提出了Alphaevolve，这是一种进化编码剂，可大大提高最先进的LLM在高度挑战的任务上，例如解决开放科学问题或优化关键的计算基础架构。 Alphaevolve策划了LLMS的自主管道，其任务是通过直接更改代码来改善算法。使用一种进化方法，不断收到一个或多个评估者的反馈，alphaevolve迭代地改善了算法，可能导致新的科学和实用发现 ...

0 0 0 2025/07/18 arXiv:2506.13131v1 ck0123

Data Augmentation as Free Lunch: Exploring the Test-Time Augmentation for Sequential Recommendation

数据增强已成为一种有前途的方法，可以在顺序建议中减轻数据稀疏性。现有方法在模型培训期间生成了新的有效的数据以提高性能。但是，部署它们需要重新训练，修改或引入其他可学习的参数 ...

0 1 0 2025/07/18 arXiv:2504.04843v3 plain

Beyond Single Models: Enhancing LLM Detection of Ambiguity in Requests through Debate

大型语言模型（LLM）在理解和生成人类语言方面表现出了重要的能力，这有助于与复杂系统更自然的互动。 However, they face challenges such as ambiguity in user requests processed by LLMs.为了应对这些挑战，本文介绍并评估了一个多代理辩论框架，旨在增强单个模型以外的检测和分辨率 ...

0 1 0 2025/07/18 arXiv:2507.12370v1 jzk

SE-VLN: A Self-Evolving Vision-Language Navigation Framework Based on Multimodal Large Language Models

视觉导航（VLN）的最新进展主要归因于新兴的大语模型（LLMS）。这些方法在教学理解和任务推理方面表现出极好的概括能力。但是，它们受到LLM的固定知识库和推理能力的限制，以防止完全融入体验知识，从而导致缺乏有效的进化能力 ...

0 1 0 2025/07/18 arXiv:2507.13152v1 jzk

A Survey of Context Engineering for Large Language Models

大语言模型（LLM）的性能从根本上取决于推论过程中提供的上下文信息。这项调查介绍了上下文工程，这是一种正式的学科，超越了简单的提示设计，以涵盖LLMS信息有效负载的系统优化。我们向其基础组件和将它们集成到智能系统中的复杂实现中，将上下文工程分解为全面的分类学 ...

0 1 0 2025/07/18 arXiv:2507.13334v1 jzk

FlowDock: Geometric Flow Matching for Generative Protein-Ligand Docking and Affinity Prediction

最近已经提出了强大的蛋白质配体结构的生成AI模型，但是这些方法中很少有人支持柔性蛋白质 - 配体对接和亲和力估计。在这样做的那些人中，没有人可以直接对多种结合配体进行同时建模，也可以在药理学相关的药物靶标上进行严格的基准测试，从而阻碍了它们在药物发现工作中的广泛采用。在这项工作中，我们提出了Flowdock，这是基于条件流量匹配的第一个深几何生成模型，该模型学会了将任意数量的结合配体数量直接映射到 ...

0 0 0 2025/07/18 arXiv:2412.10966v3 assassinkkkk

FinTSBridge: A New Evaluation Suite for Real-world Financial Prediction with Advanced Time Series Models

尽管近年来人们对时间序列的预测越来越关注，但许多研究提出了各种解决方案，以应对时间序列预测中遇到的挑战，旨在改善预测性能。但是，将这些时间序列预测模型有效地应用于金融资产定价领域仍然是一个艰巨的问题。仍然需要桥梁将尖端时间序列的预测模型与金融资产定价联系起来 ...

0 0 0 2025/07/18 arXiv:2503.06928v2 打笨蛋

Deep Knowledge Tracing with Learning Curves

知识追踪（KT）最近是计算教学法的积极研究领域。任务是根据他们过去对问题的回答来对学生的掌握知识概念的掌握水平进行建模，并预测他们将来正确回答后续问题的概率。历史上使用统计建模方法（例如贝叶斯推理和因素分析）解决了KT任务，但是深度学习的最新进展导致了连续的建议，这些建议利用了深层的神经网络，包括长期短期记忆网络，记忆启动的网络和自我意见网络 ...

0 0 0 2025/07/18 arXiv:2008.01169v2 bestenevoy

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）