在本文中,我们建立了表格视觉问答的基准,称为 TableVQA-Bench,源自现有的表格问答(QA)和表格结构识别数据集。值得注意的是,现有数据集尚未包含图像或 QA 对,而它们是 TableVQA 的两个关键组成部分。因此,本文的主要目标是获得这些必要的组件 ...
0 0 0 2025/01/12 arXiv:2404.19205v1 aezro
学习分子图的基本分布并生成高保真样本是药物发现和材料科学中的一个基本研究问题。然而,准确地建模分布和快速生成新颖的分子图仍然是至关重要且具有挑战性的目标。为了实现这些目标,我们提出了一种基于离散图结构(CDGS)的新颖条件扩散模型,用于分子图生成 ...
0 0 0 2025/01/12 arXiv:2301.00427v2 tuxiaolv
我们研究多个大型语言模型(LLM)是否可以通过玩耍、批评和批评在谈判游戏中自主地相互改进。我们对这个问题很感兴趣,如果因为LLM能够相互改进,那么意味着可能有最少的改进的人为干预创建强大的人工智能代理。我们要求LLM相互交流,分别扮演买家和卖家的角色...... ...
0 0 0 2025/01/12 arXiv:2305.10142v1 Sydney
人形机器人需要强大的下半身运动能力和精确的上半身操纵能力。虽然最近的强化学习(RL)方法提供了全身局部操纵策略,但它们缺乏高自由度臂的精确操纵。在本文中,我们建议使用逆运动学 (IK) 和运动重定向来实现精确操作,将上半身控制与运动解耦,而强化学习则专注于稳健的下半身运动 ...
0 0 0 2025/01/12 arXiv:2412.07773v1 wxxz
时间点过程 (TPP) 框架内的自回归神经网络已成为连续时间事件数据建模的标准。尽管这些模型可以以一种超前的方式表达性地捕获事件序列,但由于其顺序性质导致的误差累积,它们本质上限制了长期预测应用。为了克服这些限制,我们推导了 ADD-THIN,这是一种针对整个事件序列运行的 TPP 原则性概率去噪扩散模型 ...
0 0 0 2025/01/12 arXiv:2311.01139v2 tuxiaolv
基于扩散的图生成模型最近在图生成方面获得了有希望的结果。然而,现有的基于扩散的图生成模型大多是在去量化的邻接矩阵空间中应用高斯扩散的一次性生成模型。这种策略可能会遇到模型训练困难、采样速度慢以及无法合并约束的问题 ...
0 0 0 2025/01/12 arXiv:2307.08849v1 tuxiaolv
随着人们对表格数据的日益关注,将合成表应用于各种任务的尝试已经扩展到各种场景。由于生成建模的最新进展,表格数据合成模型生成的假数据变得复杂且现实。然而,对表格数据的离散变量(列)进行建模仍然存在困难 ...
0 0 0 2025/01/12 arXiv:2304.12654v2 tuxiaolv
在本文中,我们介绍了 SemiRES,这是一种半监督框架,可以有效地利用标记和未标记数据的组合来执行 RES。将半监督技术应用于 RES 的一个重大障碍是噪声伪标签的普遍存在,特别是在对象的边界处。 SemiRES 结合了以其精确边界划分而闻名的分段任意模型 (SAM),以提高这些伪标签的准确性 ...
0 0 0 2025/01/12 arXiv:2406.01451v1 Archer

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)