来自密度功能理论计算的材料调子导热率的计算需要对Anharmonic的原子体间力常数进行计算昂贵的评估,并且在高通量发现材料中仍然是计算瓶颈。在这项工作中,我们提出了一种通过局部学习势能表面来提取非谐力常数的机器学习辅助方法。我们证明了我们对220种三元材料的多样化收集的方法,该材料的总计算时间从480,000个CPU小时降低到少于12,000 CPU-Hours,而将热导率预测准确性保留到10% ...
有监督微调 (SFT) 和基于人类反馈的强化学习 (RLHF) 是两个基本过程,用于增强预训练后语言模型 (LM) 的能力,使其更好地符合人类偏好。尽管 SFT 在训练效率方面取得了进步,但 RLHF 提供了更好的对齐能力,因此它们经常被结合起来。然而,常见的做法只是简单地按顺序应用它们,而没有统一其优化目标,导致在适应不同目标之间进行权衡,并忽略了弥合范式差距并汲取两者优势的机会 ...
先前采用基于像素的高斯表示的工作已经证明了前馈稀疏视图重建的有效性。然而,这种表示需要跨视图重叠才能准确估计深度,并且受到对象遮挡和视锥体截断的挑战。因此,这些方法需要以场景为中心的数据采集来维持跨视图重叠和完整的场景可见性,以避免遮挡和截断,这限制了它们对以场景为中心的重建的适用性 ...
有效获取外部知识和最新信息对于大型语言模型(LLM)中的有效推理和文本生成至关重要。检索增强和工具使用培训方法,其中将搜索引擎视为工具缺乏复杂的多转弯检索灵活性或需要大规模监督数据。在推理过程中提示具有推理能力的高级LLM使用搜索引擎并不是最佳的,因为LLM无法学习如何与搜索引擎进行最佳互动 ...
传统的饮食评估方法主要基于自我报告的方法或在营养师监督下进行的结构化访谈。但是,这些方法通常是主观的,可能是不准确的且耗时的。尽管已经设计了基于人工智能(AI)的解决方案来自动化饮食评估过程,但这些先前的AI方法学在跨越各种食品类型,饮食行为和文化背景的能力方面遇到了挑战 ...
我们研究了基于知识的视觉提问问题,为此,模型需要将其陷入视觉方式中才能找到答案。尽管许多最近的作品都使用问题依赖性的字幕人来表达给定的图像并使用大型语言模型来解决VQA问题,但研究结果表明,它们对多跳的问题没有合理的表现。我们的研究表明,用几个简单的问题替换一个复杂的问题有助于从图像中提取更多相关信息,并对其进行更强有力的理解 ...
在正常条件下,对自动驾驶汽车的环境感知在过去十年中取得了巨大的成功。但是,各种不利的条件,例如雾,低光和运动模糊会降低图像质量,并对自动驾驶的安全构成巨大威胁。也就是说,当应用于退化的图像时,最先进的视觉模型经常由于特征内容丢失和由捕获图像的统计和结构特性破坏引起的特征含量丢失和伪影干扰而遭受性能下降 ...
最近,借助深图模型,表结构识别取得了令人印象深刻的进步。他们中的大多数都利用表格元素的单一视觉提示,或者只是通过早期融合将视觉提示与其他模式相结合,以推理其图形关系。但是,早期融合或以多种方式进行推理都不能适合所有多样性的各种桌子结构 ...