高含量的扰动实验使科学家可以以前所未有的分辨率探测生物分子系统,但是实验和分析的成本构成了广泛采用的显着障碍。机器学习有可能指导对扰动空间的有效探索并从这些数据中提取新见解。但是,当前的方法忽略了相关生物学的语义丰富性,其目标与下游生物学分析未对准 ...
大型语言模型(LLM)的出现从根本上改变了自然语言处理,使其在从对话系统到科学探索的范围内必不可少。但是,他们的预训练的架构通常揭示了在专业环境中的局限性,包括限制的推理能力,道德不确定性和次优的领域特定性能。这些挑战需要先进的培训后语言模型(POLMS)来解决这些缺点,例如OpenAI-O1/O3和DeepSeek-R1(统称为大型推理模型或LRMS) ...
几次分割(FSS)成功的关键在于如何有效利用支持样本。大多数解决方案将支持前景(FG)的特征压缩为原型,但丢失了一些空间细节。取而代之的是,其他人则使用未压缩支持FG的Fuse查询功能进行互相注意 ...
识别自由文本中的生物医学概念及其类型(例如,药物或基因)通常称为生物医学命名实体识别(NER),是信息提取(IE)管道的基本组成部分 ...
社区在了解社交网络中的用户行为和网络特征方面起着至关重要的作用。一些用户可以一次使用多个社交网络来实现各种目标。这些用户被称为重叠的用户,这些用户桥接了不同的社交网络 ...
我们描述了一种自主驾驶的强大规划方法,该方法通过训练运动预测的扩散模型来混合正常和对抗性剂预测输出。我们首先训练一个扩散模型,以学习正常剂行为的公正分布。然后,我们通过在测试时间偏向扩散模型来产生对抗性预测的分布,以产生可能与候选计划相撞的预测 ...
社区检测是社交网络分析中的一个基本问题,包括无监督的分裂社会参与者(社交图中的节点),以及某些社交联系(社交图中的边缘),与每个群体都与其他群体分开。社区检测的经典方法通常仅处理网络结构,而忽略其节点的特征(称为节点属性),尽管许多现实世界中的社交网络都提供了其他参与者的信息,例如兴趣。人们认为,属性可能会澄清和丰富有关演员的知识,并使社区有意义 ...
生物医学命名实体识别(NER)提出了由于专门的词汇,庞大的实体以及新实体的持续出现而引起的独特挑战。受固定分类法和人类注释约束的传统NER模型努力概括超出预定义的实体类型。为了解决这些问题,我们介绍了Gliner-Biomed,这是针对NER(Gliner)模型的域名适应性套件(Gliner)模型,专门针对生物医学量身定制 ...