在急诊科 (ED),患者在诊断前接受分诊和多项实验室检查。这一耗时的过程会导致急诊科拥挤,从而影响患者死亡率、医疗错误、员工倦怠等。这项工作提出了(时间)成本效益高的诊断辅助,利用人工智能系统帮助急诊科临床医生做出高效、准确的诊断 ...
我们提出了一种随机 MPC (SMPC) 公式,用于在涉及具有多模态预测的多个智能体的场景中自动驾驶车辆的路径规划。多模式预测捕捉了不同模式/操作下城市驾驶的不确定性(例如, ...
我们引入了连续体物理数据集(ContPhy),这是一种用于评估机器物理常识的新颖基准。 ContPhy 通过涵盖各种场景中不同物理属性(例如质量和密度)的推理并预测相应的动态,补充了现有的物理推理基准。我们评估了一系列 AI 模型,发现它们仍然难以在 ContPhy 上获得令人满意的性能,这表明当前的 AI 模型仍然缺乏连续体(尤其是软体)的物理常识,并说明了所提出的数据集的价值 ...
本文介绍了扩散蛋白语言模型(DPLM),这是一种多功能的蛋白质语言模型,展示了强大的蛋白质序列生成和预测能力。我们首先在生成式自监督离散扩散概率框架内根据进化规模的蛋白质序列预训练可扩展的 DPLM,该框架以原则性的方式概括了蛋白质的语言模型。经过预训练后,DPLM 表现出生成结构合理、新颖且多样化的蛋白质序列以进行无条件生成的能力 ...
视频配音旨在从参考视频和驱动音频信号合成逼真的口型同步视频。尽管现有的方法可以准确地生成由音频驱动的嘴型,但它们通常无法保留特定于身份的特征,这很大程度上是因为它们不能有效地捕获音频线索和参考身份的视觉属性之间微妙的相互作用。因此,生成的输出在再现参考身份的独特纹理和结构细节时经常缺乏保真度 ...
新催化剂的发现对于设计新的、更高效的化学工艺以过渡到可持续的未来至关重要。我们引入了一种人工智能引导的计算筛选框架,将语言推理与来自 3D 原子表征的基于量子化学的反馈相结合。我们的方法将催化剂发现描述为一个不确定的环境,其中代理通过大语言模型(LLM)衍生的假设和原子图神经网络(GNN)衍生的反馈的迭代组合主动搜索高效催化剂 ...
约束下的文本生成引起了人们对自然语言处理的兴趣日益浓厚,特别是随着大型语言模型的能力迅速提高。然而,约束生成的现有基准通常关注固定约束类型(例如 ...
在复杂、动态环境中导航的地面机器人必须计算无碰撞轨迹,以安全有效地避开障碍物。非凸优化是一种实时计算轨迹的流行方法。然而,这些方法往往收敛于局部最优解,并频繁地在不同的局部最小值之间切换,导致机器人运动效率低下且不安全 ...