多模态顺序推荐(MSR)利用不同的项目模态来提高推荐准确性,同时实现有效和自适应的融合仍然具有挑战性。现有的 MSR 模型经常忽视仅通过模态组合出现的协同信息。此外,他们通常假设用户之间不同方式的交互具有固定的重要性。为了解决这些限制,我们通过 \textbf{I}nformation \textbf{S}ynergy \textbf{M}odule (PRISM) 提出 \textbf{P}个性化 \textbf{R}推荐,这是一种用于顺序推荐 (SR) 的即插即用框架。 PRISM 通过交互专家层将多模态信息显式分解为独特的、冗余的和协同的组件,并通过用户偏好引导的自适应融合层动态地对它们进行加权。这种信息论设计能够实现多模态信号的细粒度解缠和个性化融合。对四个数据集和三个 SR 主干网的广泛实验证明了其有效性和多功能性。该代码可从此 https URL 获取 ...
分子表示学习对于各种下游应用至关重要,包括分子特性和副作用的分析和预测。虽然图神经网络(GNN)一直是分子数据建模的流行框架,但它们通常很难捕获分子表示的全部复杂性。在本文中,我们介绍了一种称为 GODE 的新方法,它解释了分子固有的双能级结构。分子拥有内在的图结构,同时充当更广泛的分子知识图谱中的节点。 GODE 将单个分子图表示与来自知识图的多域生化数据集成。通过在不同的图结构上预训练两个 GNN 并采用对比学习,GODE 有效地将分子结构与其相应的知识图子结构融合起来。这种融合产生了更强大、信息更丰富的表示,通过利用化学和生物信息来增强分子特性预测。当针对 11 项化学性质任务进行微调时,我们的模型显着优于现有基准,分类任务的平均 ROC-AUC 提高了 12.7%,回归任务的平均 RMSE/MAE 提高了 34.4%。值得注意的是,GODE 在属性预测方面超越了当前领先的模型,在分类任务中进步了 2.2%,在回归任务中进步了 7.2% ...
结构同一性是一种对称概念,根据网络结构及其与其他节点的关系来识别网络节点。过去几十年来,人们在理论和实践中对结构同一性进行了研究,但直到最近才用表征学习技术来解决它。这项工作提出了 struc2vec,一种新颖且灵活的框架,用于学习节点结构身份的潜在表示。 struc2vec 使用层次结构来测量不同尺度的节点相似性,并构建多层图来编码结构相似性并生成节点的结构上下文。数值实验表明,用于学习节点表示的最先进技术无法捕获更强的结构同一性概念,而 struc2vec 在此任务中表现出更优越的性能,因为它克服了先前方法的局限性。因此,数值实验表明 struc2vec 提高了更多依赖于结构特性的分类任务的性能 ...
尽管近年来图神经网络在分子性质预测任务中取得了巨大成功,但其在分布外(OOD)设置下的泛化能力仍待探索。与现有的学习判别表示进行预测的方法不同,我们提出了一种具有语义成分可识别性的生成模型,称为 SCI。我们证明,该生成模型中的潜在变量可以明确地识别为语义相关(SR)和语义不相关(SI)组件,这有助于通过涉及因果机制的最小变化属性来实现更好的 OOD 泛化。具体来说,我们首先制定从原子级到分子级的数据生成过程,其中潜在空间被分为SI子结构、SR子结构和SR原子变量。接下来,为了减少错误识别,我们限制 SR 原子变量的最小变化,并添加语义潜在子结构正则化,以减轻增强域变化下 SR 子结构的方差。在温和的假设下,我们证明了 SR 子结构的块式可识别性和 SR 原子变量的注释式可识别性。实验研究实现了最先进的性能,并在 3 个主流基准测试中的 21 个数据集上显示出总体改进。此外,所提出的 SCI 方法的可视化结果为预测结果提供了富有洞察力的案例研究和解释。该代码位于:此 https URL ...
随着社交媒体的盛行,最近出现了越来越多的推荐者,他们将重点从个人建模转向群体推荐。由于群体偏好是群体成员各种偏好的混合体,因此群体推荐的根本挑战是对成员之间的相关性进行建模。现有方法大多采用启发式或基于注意力的偏好聚合策略来综合群体偏好。然而,这些模型主要关注用户的成对连接,而忽略了群体内外复杂的高阶交互。此外,由于组项交互严重稀疏,组推荐严重受到数据稀疏问题的影响。在本文中,我们提出了一种用于群体推荐的自监督超图学习框架,以实现两个目标:(1)捕获用户之间的组内和组间交互; (2)缓解原始数据本身的数据稀疏问题。从技术上讲,对于(1),开发了基于用户级和组级超图的分层超图卷积网络,以对组内和组外用户之间复杂的元组相关性进行建模。对于(2),我们设计了一种双尺度节点丢失策略来创建自我监督信号,该信号可以针对稀疏问题以不同粒度规范用户表示。对多个基准数据集的实验分析证明了该模型的优越性,并阐明了超图建模和双尺度自监督的合理性 ...
多模式内容共享平台的蓬勃发展推动了个性化推荐系统的发展。以前的工作通常面临数据稀疏和冷启动问题,并且可能无法从多模态数据中充分探索语义用户-产品关联。为了解决这些问题,我们提出了一种新颖的多模态超图对比学习(MMHCL)框架用于用户推荐。为了从用户-产品关系中进行全面的信息探索,我们构建了两个超图,即用户到用户(u2u)超图和项目到项目(i2i)超图,以分别挖掘用户之间的共享偏好和项目之间复杂的多模态语义相似性。这个过程产生更密集的二阶语义,与一阶用户-项目交互融合作为补充,以缓解数据稀疏问题。然后,我们通过应用协同对比学习来设计对比特征增强范例。通过最大化/最小化相同/不同用户和项目的二阶(例如用户的共享偏好模式)和一阶(用户选择的项目的信息)嵌入之间的互信息,可以有效增强特征的可区分性。与仅使用稀疏的主用户-项目交互相比,我们的MMHCL获得更密集的二阶超图并挖掘更丰富的共享属性来探索用户-产品关联,这在一定程度上缓解了数据稀疏和冷启动的问题。大量的实验全面证明了我们方法的有效性。我们的代码可在以下位置公开获取:此 https URL ...
图对比学习(GCL)的最新进展在改善图表示方面表现出了显着的有效性。然而,依赖预定义的增强(例如,节点丢弃、边缘扰动、属性屏蔽)可能会导致任务相关信息的丢失以及缺乏对不同输入数据的适应性。此外,负样本的选择仍然很少被探索。在本文中,我们从超图的角度介绍了 HyperGCL,一种新颖的多模态 GCL 框架。 HyperGCL 通过联合利用输入图的结构和属性构建三个不同的超图视图,从而实现对比学习中多种模式的全面集成。可学习的自适应拓扑增强技术通过保留重要关系并滤除噪声来增强这些视图。特定于视图的编码器捕获每个视图的基本特征,而网络感知对比损失则利用底层拓扑来有效地定义正样本和负样本。对基准数据集的大量实验表明,HyperGCL 实现了最先进的节点分类性能 ...
我们提出了分子超消息传递网络(MolHMPN),它通过先验知识引导的子图来预测分子的特性。对分子中的高阶连接进行建模是必要的,因为原子之间的成对和高阶相互作用的变化会导致分子特性的变化。许多方法尝试对高阶连接进行建模。然而,这些方法严重依赖于数据驱动的方法,并且很难确定所使用的子图是否包含任何感兴趣的属性或对分子属性有任何意义。因此,我们提出 MolHMPN 利用官能团先验知识对分子中原子之间的成对和高阶连接进行建模。分子可以包含多种类型的官能团,这些官能团会影响分子的性质。例如,分子的毒性与毒物有关,例如硝基芳族基团和硫脲。 MolHMPN 使用功能组构建超图,使用领域知识引导的修改方案修改超图,使用超图消息传递 (HyperMP) 层嵌入图和超图输入,并使用更新的图和超图嵌入来预测分子的属性。我们的模型提供了一种利用化学先验知识进行分子特性预测任务的方法,并在先验知识的使用和数据驱动的修改之间进行自适应平衡。我们表明,对于大多数数据集,我们的模型能够优于其他基线方法,并表明使用领域知识引导的数据学习是有效的 ...
大型语言模型(LLM)在化学领域获得了极大的关注。然而,大多数现有数据集以分子水平的特性预测为中心,忽视了细粒度官能团(FG)信息的作用。合并 FG 级数据可以提供有价值的先验知识,将分子结构与文本描述联系起来,这些知识可用于构建更具可解释性、结构感知的 LLM ,用于对分子相关任务进行推理。此外, LLM 可以从此类细粒度信息中学习,揭示特定官能团和分子特性之间隐藏的关系,从而推进分子设计和药物发现。在这里,我们介绍 FGBench,一个包含 625K 个具有官能团信息的分子性质推理问题的数据集。官能团在分子内被精确注释和定位,这确保了数据集的互操作性,从而促进进一步的多模式应用。 FGBench 包括对跨三个类别的 245 个不同官能团的回归和分类任务,用于分子属性推理:(1) 单官能团影响,(2) 多官能团相互作用,以及 (3) 直接分子比较。在对 7K 精选数据进行最先进的 LLM 的基准测试中,结果表明,当前的 LLM 在 FG 级属性推理方面遇到了困难,这凸显了需要增强 LLM 在化学任务中的推理能力。我们预计 FGBench 中用于构建具有功能组级信息的数据集的方法将作为生成新问答对的基础框架,使 LLM 能够更好地理解细粒度的分子结构-性质关系。数据集和评估代码可在 \href{此 https URL}{此 https URL} 中获取 ...
图神经网络(GNN)在各种化学相关任务中表现出了良好的性能。然而,传统的图仅模拟分子中的成对连接,无法充分表示多中心键和共轭结构等高阶连接。为了应对这一挑战,我们引入分子超图并提出分子超图神经网络(MHNN)来预测有机半导体的光电特性,其中超边代表共轭结构。针对不规则高阶连接设计了通用算法,可以有效地操作具有各种阶超边的分子超图。结果表明,MHNN 在 OPV、OCELOTv1 和 PCQM4Mv2 数据集的大多数任务上优于所有基线模型。值得注意的是,MHNN 在没有任何 3D 几何信息的情况下实现了这一目标,超越了利用原子位置的基线模型。此外,MHNN 在有限的训练数据下比预训练的 GNN 取得了更好的性能,凸显了其出色的数据效率。这项工作为与高阶连接相关的更一般的分子表示和属性预测任务提供了一种新策略 ...