使用大型语言模型 (LLM) 进行基于表格的推理是解决许多表格理解任务(例如基于表格的问答和事实验证)的一个有前途的方向。与通用推理相比,基于表格的推理需要从自由形式的问题和半结构化表格数据中提取底层语义。思想链及其类似方法以文本上下文的形式整合了推理链,但如何在推理链中有效利用表格数据仍然是一个悬而未决的问题 ...
0 0 0 2024/04/26 arXiv:2401.04398v2 Ryann_
大型语言模型在许多 NLP 任务上取得了显着进展,研究人员正在转向更大的文本语料库来训练它们。一些最大的可用语料库是通过抓取互联网的重要部分而创建的,并且通常只用最少的文档进行介绍。在这项工作中,我们提供了 Colossal Clean Crawled Corpus 的一些第一份文档(C4;Raffel 等人) ...
0 0 0 2024/04/26 arXiv:2104.08758v2 黑色小熊饼干
我们推出 LaViLa,这是一种利用大型语言模型 (LLM) 学习视频语言表示的新方法。我们重新利用预先训练的 LLM 以视觉输入为条件,并对它们进行微调以创建自动视频旁白。我们自动生成的旁白具有许多优势,包括长视频的密集覆盖、视觉信息和文本更好的时间同步以及更高的文本多样性 ...
0 0 0 2024/04/26 arXiv:2212.04501v1 lk-aa
物理信息神经网络 (PINN) 已成为一种有前途的深度学习框架,用于近似偏微分方程 (PDE) 的数值解。然而,传统的 PINN 依赖于多层感知器(MLP),忽略了实际物理系统中固有的关键时间依赖性,因此无法在全局范围内传播初始条件约束并准确捕获各种场景下的真实解。在本文中,我们介绍了一种新颖的基于 Transformer 的框架,称为 PINNsFormer,旨在解决这一限制 ...
0 0 0 2024/04/26 arXiv:2307.11833v2 boboshen
使用微生物作为生物工厂的一个关键问题是使细胞群落达到并维持所需的密度和组成,以便它们能够有效地将其生物质转化为有用的化合物。生物反应器是实时、可扩展地控制细胞密度的有前途的技术平台。在这项工作中,我们开发了一种基于学习的策略来扩展可用控制算法的工具箱,该工具箱能够调节生物反应器中 \textit{single} 细菌群体的密度 ...
0 0 0 2024/04/26 arXiv:2312.09773v1 bioinfor
表格数据生成的最新进展极大地提高了综合数据质量。然而,由于表格数据的分布错综复杂且数据类型混合,将扩散模型扩展到表格数据具有挑战性。本文介绍了 Tabsyn,这是一种通过利用变分自动编码器 (VAE) 精心设计的潜在空间中的扩散模型来合成表格数据的方法 ...
0 0 0 2024/04/26 arXiv:2310.09656v2 hitler1991
由于大型语言模型(LLM)在各种任务上的出色的小样本性能,最近引起了越来越多的关注。然而,它在文本到SQL解析方面的性能仍然有很大的改进空间。在本文中,我们假设 LLM 在文本到 SQL 解析方面需要改进的一个关键方面是它们的多步推理能力 ...
0 0 0 2024/04/26 arXiv:2305.14215v2 Teryua
我们推出 Imagen,一种文本到图像的扩散模型,具有前所未有的照片真实感和深层次的语言理解。 Imagen 建立在大型 Transformer 语言模型在理解文本方面的能力之上,并依赖于扩散模型在高保真图像生成方面的能力。我们的关键发现是通用的大语言模型(例如 ...
0 0 0 2024/04/26 arXiv:2205.11487v1 heuwangchao

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)