视频修复在保持忠诚度方面构成了非平凡的挑战,同时从野外未知的降解中恢复了时间一致的细节。尽管基于扩散的恢复的最新进展,但这些方法通常面临生成能力和采样效率的限制。在这项工作中,我们提出了SEEDVR,这是一种扩散 Transformer ,旨在处理任意长度和分辨率的现实世界视频恢复 ...
人类科学发现的当前局限性需要新的研究范式。尽管人工智能的进步(AI)提供了一个非常有希望的解决方案,但使AI模仿人类的科学发现仍然是一个开放的挑战。为了解决这个问题,我们提出了AI-Newton,这是一个概念驱动的发现系统,能够自主从原始数据中得出物理定律 - 无需监督或事先物理知识 ...
我们介绍了生成人工智能(AI),以实证验证物理的基本定律,重点是Stefan-Boltzmann法律,将恒星温度和光度联系起来。我们的方法模拟了每个恒星的假设温度状态下的反事实仪性,并迭代地完善了深度学习体系结构中的温度 - 劳度关系。我们使用GAIA DR3数据,发现温度对亮度的影响随着恒星半径的增加而增加,并且与理论预测一致,并随着绝对幅度的减小而降低 ...
推荐系统(RECSYS)利用用户交互历史记录来预测和建议相关项目,从而塑造各个域之间的用户体验。尽管许多研究采用了一般问题定义,即 ...
本文探讨了迭代学习算法的概括特征,并采用信息理论技术的非convex损失功能有界的更新。我们的关键贡献是对这些算法具有有限更新的概括误差的新颖界限。我们的方法介绍了两个主要新颖性:1)我们将相互信息重新制定为更新的不确定性,提供了新的观点,2)我们使用差异分解技术来分解迭代信息,从而允许更简单的代孕过程 ...
我们在评估代码生成模型上介绍了新的基准:MBXP和多语言HumaneVal和Mathqa-X。这些数据集涵盖了10种编程语言,并使用可扩展的转换框架生成,该框架将原始Python数据集的提示和测试用例转移到目标语言中的相应数据中。使用这些基准测试,我们能够以多种语言方式评估代码生成模型的性能,并发现了语言模型在室外语言上的概括能力,多语言模型的优势比单语语言相对于单语语言,促使几乎没有射击的能力促 ...
大型语言模型(LLMS)在协助人类进行编程和促进编程自动化方面表现出色。但是,现有的基准评估LLMS的代码理解和产生能力的基准受到严重限制。首先,大多数基准都不足够,因为它们专注于狭窄的流行编程语言和特定任务,而现实世界中的软件开发方案表明,对于具有多种语言和多任务编程环境的系统以满足各种要求 ...
大型语言模型(LLMS)在产生连贯和上下文相关的响应方面取得了显着的进步。但是,幻觉 - 不正确或毫无根据的主张 - 仍然很普遍,促使创建自动指标以在LLM输出中检测到这些指标。我们的贡献包括:引入Chainpoll,这是一种与同行相比的创新幻觉检测方法,并揭示了Realhall,这是一个精致的基准数据集集合,可评估最近研究的幻觉检测指标 ...