近年来,CNN和基于 Transformer 的方法在微观图像分类(MIC)方面取得了重大进展。但是,现有方法仍然面临着全球建模和有效计算之间的困境。虽然选择性状态空间模型(SSM)可以模拟具有线性复杂性的远程依赖性,但它仍然遇到MIC中的挑战,例如本地像素遗忘,通道冗余和缺乏本地知觉 ...
Meta-World广泛用于评估多任务和元加强学习者,这对同时掌握多样化技能的挑战。然而,自引入以来,已经进行了许多无证件变化,抑制了算法的公平比较。这项工作旨在消除文献中的这些结果,同时还利用Meta-World的过去版本提供有关多任务和元强化学习基准设计的见解 ...
以参数有效的方式进行微调预训练的大型语言模型的有效性和效率得到了广泛研究。流行的低级适应方法(LORA)提供了一种显着的方法,假设适应过程本质上是低维的。尽管洛拉(Lora)表现出值得称赞的表现,但它以固定且不可变的内在等级实施,这可能并不总是是理想的选择 ...
我们通过将颗粒从初始源分布传输到目标分布,提出了一种生成模型的梯度流程,在该粒子上,粒子上的梯度场是由最大平均差异(MMD)的噪声自动剂量梯度给出的。噪声自适应MMD经过通过向前扩散过程获得的噪声损坏的数据分布进行培训,这通常用于降级扩散概率模型。结果是MMD梯度流的概括,我们称之为扩散-MMD级别流量或DMMD ...
多模式的大语言模型(MLLM)变得越来越流行,而与多模式数据输入相关的高计算成本,尤其是从视觉 Token 中,构成了重大挑战。现有的基于培训的 Token 压缩方法提高了推理效率,但需要昂贵的再训练,而无培训方法在积极降低 Token 计数时努力保持性能。在这项研究中,我们揭示了MLLM的性能降解与注意输出矩阵中信息的加速损失密切相关 ...
电子健康记录(EHRS)包含有价值的患者数据,用于与健康相关的预测任务,例如疾病预测。传统方法依赖于需要大型标记数据集的监督学习方法,这可能是昂贵且具有挑战性的。在这项研究中,我们研究了应用大语言模型(LLM)转换结构化患者访问数据的可行性(e ...
多代理系统代表了人工智能方面的重大进步,通过协调的专用代理实现了复杂的问题。但是,这些系统在上下文管理,协调效率和可扩展操作方面面临着根本挑战。本文介绍了一个综合框架,用于通过模型上下文协议(MCP)推进多代理系统,并通过标准化的上下文共享和协调机制来应对这些挑战 ...
最近,由于其广泛的应用,场景文本检测受到了极大的关注。但是,在多个尺度,方向和曲率的复杂场景中的准确检测仍然是一个挑战。许多检测方法采用了VATTI剪辑(VC)算法进行多个现有培训,以解决任意形状的文本问题 ...