图结构数据的深度生成模型为化学合成问题提供了一个新的角度:通过优化直接生成分子图的可微分模型,可以在离散且广阔的化学结构空间中避开昂贵的搜索过程。我们引入了莫尔根,这是一种用于小分子图的隐式、无似然生成模型,它避免了对昂贵的图匹配程序或先前基于似然的方法的节点排序启发式的需要。我们的方法采用生成对抗网络(,它避免了对昂贵的图匹配程序或先前基于似然的方法的节点排序启发式的需要。我们的方法采用生成对抗 ...
人类运动预测,即预测的未来身体姿势给定观察到的姿势序列,通常已通过反复的神经网络(RNN)来解决 ...
神经体系结构搜索(NAS)的目的是通过出色的测试性能自动挖掘最佳网络体系结构。最近的神经体系结构搜索(NAS)方法依赖于验证损失或准确性来找到目标数据的出色网络。在本文中,我们研究了一种新的神经体系结构搜索措施,以更好地概括挖掘架构 ...
视觉问题回答的多模式任务(VQA)涵盖了计算机视觉(CV)和自然语言处理(NLP)的元素,旨在为任何视觉输入的问题生成答案。随着时间的流逝,VQA的范围已从关注大量自然图像集合到具有合成图像,视频,3D环境和各种其他视觉输入的数据集扩展。大型预训练网络的出现改变了依赖特征提取和融合方案的早期VQA方法,转向视觉语言预训练(VLP)技术 ...
人工智能在医学视觉问题答案(MED-VQA)中提高了,但是普遍的研究倾向于集中在答案的准确性上,通常忽略了在临床环境中至关重要的推理路径和可解释性。此外,当前的MED-VQA算法通常依赖于单数模型,缺乏通常需要协作专家评估的真实医学诊断所需的鲁棒性。为了解决这些缺点,本文介绍了MedCot,这是一种新型的分层专家验证推理链方法,旨在提高生物医学成像查询的可解释性和准确性 ...
编程语言具有丰富的语义信息,例如由图表示的数据流,并且从源代码的表面形式无法获得。最近的代码语言模型已扩展到数十亿个参数,但模型源代码仅为文本 Token ,同时忽略了任何其他结构信息。相反,编码代码结构信息的模型对 Transformer 体系结构进行了修改,从而限制了其比例和与验证的LLM的兼容性 ...
用户身份链接(UIL)是不同社交网络上一个人的匹配帐户,是跨网络数据挖掘的基本任务。最近的工作通过利用图形神经网络(GNN)来捕获网络结构来实现有希望的结果。但是,他们很少分析阻碍UIL性能的逼真的节点级瓶颈 ...
视觉问题回答(VQA)从越来越复杂的模型中受益,但在数据创建方面并没有享有相同水平的参与度。在本文中,我们提出了一种通过利用现有图像捕获注释的丰富性与神经模型相结合的文本问题生成的方法,该方法会自动衍生VQA示例。我们表明,所得数据是高质量的 ...