一译 —— 文档和论文翻译、对照阅读、讨论和社区

SeedVR: Seeding Infinity in Diffusion Transformer Towards Generic Video Restoration

视频修复在保持忠诚度方面构成了非平凡的挑战，同时从野外未知的降解中恢复了时间一致的细节。尽管基于扩散的恢复的最新进展，但这些方法通常面临生成能力和采样效率的限制。在这项工作中，我们提出了SEEDVR，这是一种扩散 Transformer ，旨在处理任意长度和分辨率的现实世界视频恢复 ...

0 0 0 2025/06/12 arXiv:2501.01320v4 viczn

AI-Newton: A Concept-Driven Physical Law Discovery System without Prior Physical Knowledge

人类科学发现的当前局限性需要新的研究范式。尽管人工智能的进步（AI）提供了一个非常有希望的解决方案，但使AI模仿人类的科学发现仍然是一个开放的挑战。为了解决这个问题，我们提出了AI-Newton，这是一个概念驱动的发现系统，能够自主从原始数据中得出物理定律 - 无需监督或事先物理知识 ...

0 0 0 2025/06/12 arXiv:2504.01538v1 kkkk

Generative AI for Validating Physics Laws

我们介绍了生成人工智能（AI），以实证验证物理的基本定律，重点是Stefan-Boltzmann法律，将恒星温度和光度联系起来。我们的方法模拟了每个恒星的假设温度状态下的反事实仪性，并迭代地完善了深度学习体系结构中的温度 - 劳度关系。我们使用GAIA DR3数据，发现温度对亮度的影响随着恒星半径的增加而增加，并且与理论预测一致，并随着绝对幅度的减小而降低 ...

0 0 0 2025/06/12 arXiv:2503.17894v2 kkkk

Are We Solving a Well-Defined Problem? A Task-Centric Perspective on Recommendation Tasks

推荐系统（RECSYS）利用用户交互历史记录来预测和建议相关项目，从而塑造各个域之间的用户体验。尽管许多研究采用了一般问题定义，即 ...

0 0 0 2025/06/12 arXiv:2503.21188v2 zhuyuhe

Generalization error bounds for iterative learning algorithms with bounded updates

本文探讨了迭代学习算法的概括特征，并采用信息理论技术的非convex损失功能有界的更新。我们的关键贡献是对这些算法具有有限更新的概括误差的新颖界限。我们的方法介绍了两个主要新颖性：1）我们将相互信息重新制定为更新的不确定性，提供了新的观点，2）我们使用差异分解技术来分解迭代信息，从而允许更简单的代孕过程 ...

0 0 0 2025/06/12 arXiv:2309.05077v3 Daenerays

Multi-lingual Evaluation of Code Generation Models

我们在评估代码生成模型上介绍了新的基准：MBXP和多语言HumaneVal和Mathqa-X。这些数据集涵盖了10种编程语言，并使用可扩展的转换框架生成，该框架将原始Python数据集的提示和测试用例转移到目标语言中的相应数据中。使用这些基准测试，我们能够以多种语言方式评估代码生成模型的性能，并发现了语言模型在室外语言上的概括能力，多语言模型的优势比单语语言相对于单语语言，促使几乎没有射击的能力促 ...

0 0 0 2025/06/12 arXiv:2210.14868v3 15966829631

CodeScope: An Execution-based Multilingual Multitask Multidimensional Benchmark for Evaluating LLMs on Code Understanding and Generation

大型语言模型（LLMS）在协助人类进行编程和促进编程自动化方面表现出色。但是，现有的基准评估LLMS的代码理解和产生能力的基准受到严重限制。首先，大多数基准都不足够，因为它们专注于狭窄的流行编程语言和特定任务，而现实世界中的软件开发方案表明，对于具有多种语言和多任务编程环境的系统以满足各种要求 ...

0 0 0 2025/06/12 arXiv:2311.08588v3 15966829631

Chainpoll: A high efficacy method for LLM hallucination detection

大型语言模型（LLMS）在产生连贯和上下文相关的响应方面取得了显着的进步。但是，幻觉 - 不正确或毫无根据的主张 - 仍然很普遍，促使创建自动指标以在LLM输出中检测到这些指标。我们的贡献包括：引入Chainpoll，这是一种与同行相比的创新幻觉检测方法，并揭示了Realhall，这是一个精致的基准数据集集合，可评估最近研究的幻觉检测指标 ...

0 0 0 2025/06/12 arXiv:2310.18344v1 mjwei

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）