arxiv的文档

arxiv 南京

个性签名 ...

NCoRE: Neural Counterfactual Representation Learning for Combinations of Treatments

与许多领域（例如医疗保健，公共政策或经济学），估计个人对干预措施的潜在反应具有很高的实际相关性。在这种情况下，通常可以同时采用干预措施的组合，例如，医疗保健或经济学的不同财政和货币措施中的多个处方。但是，现有的反事实推断方法仅限于不同时使用操作的设置 ...

0 0 0 0 2025/07/08 arXiv:2103.11175v1 zhr

BANC: Towards Efficient Binaural Audio Neural Codec for Overlapping Speech

我们介绍了Banc，这是一种神经双耳音频编解码器，旨在在单一和两扬声器场景中有效的语音压缩，同时保留每个说话者的空间位置信息。我们的关键贡献如下：1）我们提出的模型压缩和解码演讲重叠的能力。 2）一种新颖的结构，可分别压缩语音内容和空间提示，确保解码后每个说话者的空间环境保存 ...

0 1 0 0 2025/07/08 arXiv:2309.07416v4 wenwen

Uncertainty-based Continual Learning with Adaptive Regularization

我们引入了一种新的基于神经网络的持续学习算法，被称为不确定性调节的持续学习（UCL），该算法基于传统的贝叶斯在线学习框架，并具有变异推理。我们专注于最近提出的基于正规化的方法的两个重要缺点：a）确定每次重量正规化强度的额外记忆成本，b）缺乏优雅忘记的方案，这可以防止在学习新任务中的绩效退化。在本文中，我们表明UCL可以通过对高斯平均场近似值的变异下限的Kullback-Leibler（KL）发散项引入新的解释来解决这两个问题 ...

0 0 0 0 2025/07/08 arXiv:1905.11614v3 19396386025

Online Structured Laplace Approximations For Overcoming Catastrophic Forgetting

我们介绍了克罗内克（Kronecker）的在线拉普拉斯（Laplace）近似，以克服神经网络中的灾难性遗忘。该方法基于贝叶斯在线学习框架，在该框架中，我们在每项任务后都会递归地将后部近似于高斯，从而导致重量变化的二次惩罚。拉普拉斯的近似需要在一种模式周围计算黑森州，这通常在现代体系结构上很棘手 ...

0 0 0 0 2025/07/08 arXiv:1805.07810v1 19396386025

Overcoming Catastrophic Forgetting by Incremental Moment Matching

灾难性遗忘是神经网络的一个问题，它在训练第二任任务后失去了第一个任务的信息。在这里，我们提出了一种方法，即 ...

0 0 0 0 2025/07/08 arXiv:1703.08475v3 19396386025

RoboRefer: Towards Spatial Referring with Reasoning in Vision-Language Models for Robotics

空间引用是体现机器人与3D物理世界相互作用的基本能力。但是，即使有了强大的审慎视觉语言模型（VLM），最近的方法仍然没有资格准确地了解复杂的3D场景，并动态地了解指令指示的互动位置。为此，我们提出了Roborefer，Roborefer是一种3D感知的VLM，可以通过监督的微调（SFT）整合散布但专用的深度编码器，首先可以实现精确的空间理解 ...

0 0 0 0 2025/07/08 arXiv:2506.04308v1 李德栋

MoGe-2: Accurate Monocular Geometry with Metric Scale and Sharp Details

我们提出了Moge-2，这是一种先进的开放域几何估计模型，该模型从单个图像中恢复了场景的公制3D点图。我们的方法基于最近的单眼几何估计方法Moge，该方法可以预测具有未知尺度的仿射不变点图。我们探索了有效的策略，以扩展MOGE进行度量几何预测，而不会损害仿射不变点表示提供的相对几何精度 ...

0 0 0 0 2025/07/08 arXiv:2507.02546v1 dsy

Sensitivity-Aware Visual Parameter-Efficient Fine-Tuning

视觉参数有效的微调（PEFT）已成为完整微调的强大替代方法，以使预训练的视觉模型适应下游任务，该任务只会调节少量参数，同时冻结绝大多数的参数以减轻存储负担和优化的难度。但是，现有的PEFT方法将可训练的参数引入了不同任务的相同位置，这仅取决于人类的启发式和忽略域间隙。为此，我们通过提出一种新颖的敏感性视觉参数有效的微调（SPT）方案来研究介绍的位置以及如何分配可训练的参数，该方案将可训练的参数自适应地分配给特定于任务的重要位置，给定所需的可调参数预算 ...

0 0 0 0 2025/07/08 arXiv:2303.08566v2 19396386025

ToolFuzz -- Automated Agent Tool Testing

大型语言模型（LLM）代理利用现实世界应用中LLM的高级推理功能。要与环境接口，这些代理通常依靠工具，例如Web搜索或数据库API。由于代理向LLM提供了沿用户查询的工具文档，因此本文档的完整性和正确性至关重要 ...

0 0 0 0 2025/07/08 arXiv:2503.04479v3 wdn

Late Chunking: Contextual Chunk Embeddings Using Long-Context Embedding Models

许多用例需要检索较小部分的文本，并且基于密集向量的检索系统通常在较短的文本段上表现更好，因为语义在嵌入中不太可能“过度压缩”。因此，从业者经常将文本文档分割成更小的块并单独编码。然而，以这种方式创建的块嵌入可能会丢失周围块的上下文信息，从而导致表示不理想 ...

0 0 0 0 2025/07/08 arXiv:2409.04701v3 weight