与许多领域(例如医疗保健,公共政策或经济学),估计个人对干预措施的潜在反应具有很高的实际相关性。在这种情况下,通常可以同时采用干预措施的组合,例如,医疗保健或经济学的不同财政和货币措施中的多个处方。但是,现有的反事实推断方法仅限于不同时使用操作的设置 ...
我们介绍了Banc,这是一种神经双耳音频编解码器,旨在在单一和两扬声器场景中有效的语音压缩,同时保留每个说话者的空间位置信息。我们的关键贡献如下:1)我们提出的模型压缩和解码演讲重叠的能力。 2)一种新颖的结构,可分别压缩语音内容和空间提示,确保解码后每个说话者的空间环境保存 ...
我们引入了一种新的基于神经网络的持续学习算法,被称为不确定性调节的持续学习(UCL),该算法基于传统的贝叶斯在线学习框架,并具有变异推理。我们专注于最近提出的基于正规化的方法的两个重要缺点:a)确定每次重量正规化强度的额外记忆成本,b)缺乏优雅忘记的方案,这可以防止在学习新任务中的绩效退化。在本文中,我们表明UCL可以通过对高斯平均场近似值的变异下限的Kullback-Leibler(KL)发散项引入新的解释来解决这两个问题 ...
我们介绍了克罗内克(Kronecker)的在线拉普拉斯(Laplace)近似,以克服神经网络中的灾难性遗忘。该方法基于贝叶斯在线学习框架,在该框架中,我们在每项任务后都会递归地将后部近似于高斯,从而导致重量变化的二次惩罚。拉普拉斯的近似需要在一种模式周围计算黑森州,这通常在现代体系结构上很棘手 ...
灾难性遗忘是神经网络的一个问题,它在训练第二任任务后失去了第一个任务的信息。在这里,我们提出了一种方法,即 ...
空间引用是体现机器人与3D物理世界相互作用的基本能力。但是,即使有了强大的审慎视觉语言模型(VLM),最近的方法仍然没有资格准确地了解复杂的3D场景,并动态地了解指令指示的互动位置。为此,我们提出了Roborefer,Roborefer是一种3D感知的VLM,可以通过监督的微调(SFT)整合散布但专用的深度编码器,首先可以实现精确的空间理解 ...
我们提出了Moge-2,这是一种先进的开放域几何估计模型,该模型从单个图像中恢复了场景的公制3D点图。我们的方法基于最近的单眼几何估计方法Moge,该方法可以预测具有未知尺度的仿射不变点图。我们探索了有效的策略,以扩展MOGE进行度量几何预测,而不会损害仿射不变点表示提供的相对几何精度 ...
视觉参数有效的微调(PEFT)已成为完整微调的强大替代方法,以使预训练的视觉模型适应下游任务,该任务只会调节少量参数,同时冻结绝大多数的参数以减轻存储负担和优化的难度。但是,现有的PEFT方法将可训练的参数引入了不同任务的相同位置,这仅取决于人类的启发式和忽略域间隙。为此,我们通过提出一种新颖的敏感性视觉参数有效的微调(SPT)方案来研究介绍的位置以及如何分配可训练的参数,该方案将可训练的参数自适应地分配给特定于任务的重要位置,给定所需的可调参数预算 ...
大型语言模型(LLM)代理利用现实世界应用中LLM的高级推理功能。要与环境接口,这些代理通常依靠工具,例如Web搜索或数据库API。由于代理向LLM提供了沿用户查询的工具文档,因此本文档的完整性和正确性至关重要 ...
许多用例需要检索较小部分的文本,并且基于密集向量的检索系统通常在较短的文本段上表现更好,因为语义在嵌入中不太可能“过度压缩”。因此,从业者经常将文本文档分割成更小的块并单独编码。然而,以这种方式创建的块嵌入可能会丢失周围块的上下文信息,从而导致表示不理想 ...