代理目录服务(ADS)是发现AI代理功能,元数据和出处的分布式目录。它利用内容加入的存储,分层分类法和加密签名来实现异构多机构系统(MAS)的有效,可验证和多维发现。广告建立在开放的代理模式框架(OASF)上,通过基于Kademlia的分布式Hash表(DHT)实现的两级映射将功能从内容位置索引 ...
最近,由于在空间域中应用自我注意力的机制来建模全球知识,视觉 Transformer (VIT)已在医学图像分割(MIS)中广泛使用。但是,许多研究集中在改善空间域中的模型,同时忽略了频域信息的重要性。因此,我们通过用我们的多轴外部权重块在VIT中替换VIT的自我注意力,提出了基于U形架构的多轴外部权重UNET(MEW-UNET) ...
大型多模态模型(LMM)通过联合学习混合数据集表现出卓越的多任务处理能力。然而,在动态世界中会连续遇到新任务,并且不断微调 LMM 通常会导致性能下降。为了应对灾难性遗忘的挑战,现有方法利用数据重放或模型扩展,这两种方法都不是专门为 LMM 开发的,并且有其固有的局限性 ...
视觉语言动作(VLA)模型通常通过在机器人数据上预先培训大规模视觉模型(VLM)来弥合感知空间和动作空间之间的差距。尽管这种方法大大提高了性能,但也会造成巨大的培训成本。在本文中,我们研究了如何有效地将视觉语言(VL)表示为动作(a) ...
直接偏好优化(DPO)已成为一种简单有效的方法,用于使大型语言模型(LLMS)与人类偏好保持一致,从而绕开了对学习奖励模型的需求。尽管采用的采用越来越大,但一个基本问题仍然开放:偏好数据的哪些特征对于DPO性能最重要?在这项工作中,我们从理论和经验的角度从偏好数据分配如何影响DPO进行了系统的研究。我们表明,所选响应的质量在优化DPO目标方面起着主导作用,而被拒绝的响应的质量可能具有相对有限的影响 ...
在许多科学和工程领域中预测复杂系统的行为至关重要,并且取决于模型捕获其潜在动态的能力。现有方法通过潜在表示编码高维观测的固有动力学,并进行自动重压。但是,这些潜在表示失去了时空动力学的固有空间结构,从而导致预测器无法有效地模拟空间相互作用并在长期预测期间忽略了新兴动力学 ...
视觉语言模型(VLM)由于其强大的推理能力而引起了人们对自主驾驶的兴趣。但是,现有的VLM通常利用针对当前场景量身定制的离散文本链链(COT),这基本上代表了视觉信息的高度抽象和符号的压缩,可能导致时空关系歧义和细粒度的信息丢失。在现实世界模拟和想象力上,自主驾驶是否比纯符号逻辑更好地建模?在本文中,我们提出了一种时空的COT推理方法,该方法使模型可以视觉思考 ...
已经对磁共振成像(MRI)进行了广泛的研究,已广泛研究了跨模式合成(CMS),超分辨率(SR)及其组合(CMSR)。他们的主要目标是通过合成所需的方式并减少切片厚度来提高成像质量。尽管有令人鼓舞的合成结果,但这些技术通常是针对特定任务量身定制的,从而限制了它们对复杂临床方案的适应性 ...