工具学习可以进一步扩大大语模型(LLM)的使用情况。但是,大多数现有方法要么需要对模型只能使用训练数据中看到的工具进行填补,要么以较低的效率将工具演示添加到提示中。在本文中,我们提出了一种新的工具学习方法 ...
0 0 0 2025/03/27 arXiv:2503.16779v1 OrganicWater
使用零件级的功能进行行人图像描述提供了细粒度的信息,并已被验证为在最近的文献中对人的检索有益。零件发现的先决条件是每个部分都应位置良好。而不是使用外部提示,e ...
0 0 0 2025/03/27 arXiv:1711.09349v3 L1MICH233
随着大视觉模型(LVLM)的计算需求的增加,可视化 Token 修剪已被证明有效提高了推理速度和记忆效率。 LVLMS中的传统修剪方法主要集中在注意力评分上,以确定 Token 相关性,忽略了诸如空间位置和 Token 相似性之类的关键方面。为此,我们介绍了Adaptprune,这是一种新颖的插件训练修剪方法,它通过将空间距离和 Token 与自适应NMS方法整合和 Token 相似性建立在常规的 ...
0 0 0 2025/03/27 arXiv:2503.08019v1 dddd
重建结构的无监督方法在捕获同一类别不同形状之间一致结构的几何细节方面面临重大挑战。为了解决这个问题,我们提出了一种基于新的可变形原始场(DPF)表示的新型无监督的结构重建方法,称为DPF-NET,该方法允许使用参数化几何原始素进行高质量的形状重建。我们设计了一个两阶段的重建管道,该管道由原始生成模块和原始变形模块组成,以逐渐近似每个部分的目标形状 ...
0 0 0 2025/03/27 arXiv:2308.13225v1 Tyranitar
在计算机视觉和自然语言处理中,自动描述带有句子的图像是一个长期的挑战。由于对象检测,属性分类,动作识别等的最新进展,因此对该领域有了新的兴趣 ...
0 0 0 2025/03/27 arXiv:1411.5726v2 wangyadong
最近已证明大型预训练的序列模型,例如基于 Transformer 的体系结构,具有进行内部文化学习(ICL)的能力。在ICL中,对新输入的决定是通过直接映射输入的直接映射,以及从给定任务中的一些示例,作为任务上下文到输出变量。不需要对模型参数的明确更新来量身定制新任务的决定 ...
0 0 0 2025/03/27 arXiv:2311.06101v2 zwk123
我们提出了一种混合方法,以使用高斯混合模型(GMM)和一分为二的k-Means群集步骤结合使用高斯混合模型(GMM),以准确估算系统稳态概率密度函数的对数的梯度。我们称为kgmm的方法提供了一种系统的方式,可以将统计密度估计与基于神经网络的分数结合在一起,从而利用了两者的优势。我们证明了它可以准确重建多个范式系统的长期统计特性的能力,包括较低的势能系统和混乱的洛伦兹型模型 ...
0 0 0 2025/03/27 arXiv:2503.18054v2 milimiko
数据评估旨在量化单个数据源在培训机学习(ML)模型中的实用性,并且是以数据为中心的ML研究的关键方面。但是,尽管具有重要意义,但数据评估仍面临着大量但经常忽视的隐私挑战。本文研究了这些挑战,重点是KNN-Shapley,这是当今最实用的数据评估方法之一 ...
0 0 0 2025/03/27 arXiv:2308.15709v2 ajingo

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)