由于幻觉,数学推理对于大语模型(LLM)仍然是一个重大挑战。当与精益等正式的证明助手结合使用时,可以通过严格的验证来消除这些幻觉,从而使定理可靠。但是,即使经过正式验证,LLM仍然在长期证明和复杂的数学形式上挣扎 ...
通过人均微调在基准数据集上在基准数据集上表现出色,已经取得了巨大的进步。但是,实现强大的零弹性概括 - 其他计算机视觉任务中基础模型的标志 - 对于立体声匹配仍然具有挑战性。我们介绍了基础TEREO,这是一个基础模型,用于立体声深度估计,旨在实现强烈的零光概括 ...
在点云中闭塞引起的不完整的常见发生使点云完成(PCC)在几何处理领域中成为高度关注的任务。现有的PCC方法通常以粗到最细化的范式从部分点云中产生完整的点云,而粗阶段产生了整个形状,并且精细的阶段改善了纹理细节。尽管扩散模型在粗阶段表现出了有效性,但由于PCC的不良性质,良好的阶段仍然面临着产生高保真结果的挑战 ...
由于其丰富的表现力,扩散政策在模仿学习和离线增强学习(RL)方面取得了出色的表现。但是,香草扩散训练程序需要目标分布中的样本,这在在线RL中是不可能的,因为我们无法从最佳政策中采样,从而使培训扩散政策在在线RL中极为不足。通过扩散过程对政策梯度进行反向传播会导致巨大的计算成本和不稳定,因此昂贵且不切实际 ...
长篇文章大语言模型(LLM)的最新进展主要集中在处理扩展的输入环境上,从而在长期文化理解中取得了显着的进步。但是,产生长期产出的同样关键方面的关注相对较少。本文主张NLP研究的范式转变,以应对长期产生的挑战 ...
表结构识别(TSR)的目的是将图像中的表提取到机器可行的格式中。最近的方法通过预测检测到的单元箱的邻接关系或学习直接从表图像生成相应的标记序列来解决此问题。但是,现有方法要么依靠恢复表结构的其他启发式规则,要么在捕获表中的长期依赖性方面面临挑战,从而增加了复杂性 ...
大型语言模型(llm)的最新进展使得基于上下文学习(icl)的方法成为可能,sql任务中的性能显着优于微调方法。然而,bird)的基准测试中 ...
本文提出了一种称为Chameleon的高效神经网络(NN)体系结构设计方法,该方法对资源限制进行了尊重。我们的方法没有开发新的构建块或使用计算密集型的增强学习算法,而是利用现有的有效网络构建块,并着重于利用硬件特征并调整计算资源以适合目标延迟和/或能量限制。我们在优化框架中制定了平台感知的NN体系结构搜索,并提出了一种新型算法,以搜索有效的准确性和资源(延迟和/或能量)预测指标的帮助 ...