在本文中,我们建立了表格视觉问答的基准,称为 TableVQA-Bench,源自现有的表格问答(QA)和表格结构识别数据集。值得注意的是,现有数据集尚未包含图像或 QA 对,而它们是 TableVQA 的两个关键组成部分。因此,本文的主要目标是获得这些必要的组件 ...
学习分子图的基本分布并生成高保真样本是药物发现和材料科学中的一个基本研究问题。然而,准确地建模分布和快速生成新颖的分子图仍然是至关重要且具有挑战性的目标。为了实现这些目标,我们提出了一种基于离散图结构(CDGS)的新颖条件扩散模型,用于分子图生成 ...
我们研究多个大型语言模型(LLM)是否可以通过玩耍、批评和批评在谈判游戏中自主地相互改进。我们对这个问题很感兴趣,如果因为LLM能够相互改进,那么意味着可能有最少的改进的人为干预创建强大的人工智能代理。我们要求LLM相互交流,分别扮演买家和卖家的角色...... ...
人形机器人需要强大的下半身运动能力和精确的上半身操纵能力。虽然最近的强化学习(RL)方法提供了全身局部操纵策略,但它们缺乏高自由度臂的精确操纵。在本文中,我们建议使用逆运动学 (IK) 和运动重定向来实现精确操作,将上半身控制与运动解耦,而强化学习则专注于稳健的下半身运动 ...
时间点过程 (TPP) 框架内的自回归神经网络已成为连续时间事件数据建模的标准。尽管这些模型可以以一种超前的方式表达性地捕获事件序列,但由于其顺序性质导致的误差累积,它们本质上限制了长期预测应用。为了克服这些限制,我们推导了 ADD-THIN,这是一种针对整个事件序列运行的 TPP 原则性概率去噪扩散模型 ...
基于扩散的图生成模型最近在图生成方面获得了有希望的结果。然而,现有的基于扩散的图生成模型大多是在去量化的邻接矩阵空间中应用高斯扩散的一次性生成模型。这种策略可能会遇到模型训练困难、采样速度慢以及无法合并约束的问题 ...
随着人们对表格数据的日益关注,将合成表应用于各种任务的尝试已经扩展到各种场景。由于生成建模的最新进展,表格数据合成模型生成的假数据变得复杂且现实。然而,对表格数据的离散变量(列)进行建模仍然存在困难 ...
在本文中,我们介绍了 SemiRES,这是一种半监督框架,可以有效地利用标记和未标记数据的组合来执行 RES。将半监督技术应用于 RES 的一个重大障碍是噪声伪标签的普遍存在,特别是在对象的边界处。 SemiRES 结合了以其精确边界划分而闻名的分段任意模型 (SAM),以提高这些伪标签的准确性 ...