arxiv的文档

arxiv 南京

个性签名 ...

SAM-U: Multi-box prompts triggered uncertainty estimation for reliable SAM in medical image

最近，分割任何东西已迈出了一般人工智能的重要一步。同时，其可靠性和公平性也引起了人们的极大关注，尤其是在医疗保健领域。在这项研究中，我们提出了多盒提示，引发了SAM提示的不确定性估计，以证明分段病变或组织的可靠性 ...

0 0 0 0 2025/06/20 arXiv:2307.04973v1 mixiu

CFReID: Continual Few-shot Person Re-Identification

现实世界的监视系统正在动态发展，要求人员重新识别模型不断处理来自各个领域的新传入数据。为了应对这些动力学，已经提出了终身性REID（LREID）来逐步学习和积累知识。但是，LREID模型需要在每个看不见的域进行大规模标记数据进行培训，由于隐私和成本问题，通常无法访问它们 ...

0 0 0 0 2025/06/20 arXiv:2503.18469v1 hx5563

GRAG: Graph Retrieval-Augmented Generation

虽然检索增强生成（RAG）通过生成语言模型提高了响应的准确性和相关性，但它在文本和拓扑信息都很重要的基于图的上下文中存在不足。朴素的 RAG 方法本质上忽略了文本图的结构复杂性，导致生成过程中存在关键差距。为了应对这一挑战，我们引入了$\textbf{图检索增强生成（GRAG）}$，它通过强调子图结构的重要性来显着增强检索和生成过程 ...

0 0 0 0 2025/06/20 arXiv:2405.16506v2 aulisa

Boosting Reward Model with Preference-Conditional Multi-Aspect Synthetic Data Generation

奖励模型 (RM) 对于使大型语言模型 (LLM) 与人类偏好保持一致至关重要。他们使用偏好数据集进行训练，其中每个示例都包含一个输入提示、两个响应和一个偏好标签。由于构建高质量的人类标记偏好数据集既耗时又昂贵，人们通常依赖现有强大的 LLM 来生成偏好标签 ...

0 0 0 0 2025/06/20 arXiv:2407.16008v2 Chris_

3D human pose estimation in video with temporal convolutions and semi-supervised training

在这项工作中，我们证明，可以通过基于扩张的时间卷积在2D关键点上的扩张时间卷积来有效地估算视频中的3D姿势。我们还介绍了一种简单有效的半监督训练方法，该方法利用了未标记的视频数据。我们从未标记的视频预测的2D关键点开始，然后估算3D姿势，最后回到输入2D关键点 ...

0 0 0 0 2025/06/20 arXiv:1811.11742v2 qinhui_cici

CLONE: Closed-Loop Whole-Body Humanoid Teleoperation for Long-Horizon Tasks

类人动物的近亲在演示和收集复杂的类人形景相互作用的数据中起着至关重要的作用。但是，当前的远程操作系统面临着关键的局限性：它们将上半身控制和下半身控制脱致以保持稳定性，限制自然协调并在没有实时位置反馈的情况下操作开环，从而导致累积的漂移。基本的挑战是在延长的持续时间内实现精确的，协调的全身远程运行，同时保持准确的全球定位 ...

0 0 1 1 2025/06/20 arXiv:2506.08931v1 Langston

Align Attention Heads Before Merging Them: An Effective Way for Converting MHA to GQA

大型语言模型已被证明可以在各种自然语言处理问题上表现良好。但是，随着模型大小和输入序列的长度的增加，KV缓存的迅速增加显着降低了推理速度。因此，GQA模型是MHA模型的替代方法，已被广泛引入LLMS ...

0 0 0 0 2025/06/20 arXiv:2412.20677v1 youkbok

TAROT: Targeted Data Selection via Optimal Transport

我们提出了塔罗牌，塔罗牌是一个以最佳运输理论为基础的目标数据选择框架。先前的目标数据选择方法主要依赖于基于影响力的贪婪启发式方法来增强特定领域的性能。虽然对有限的单峰数据有效（i ...

0 0 0 0 2025/06/20 arXiv:2412.00420v1 the_highflyer

CheXGenBench: A Unified Benchmark For Fidelity, Privacy and Utility of Synthetic Chest Radiographs

我们介绍了Chexgenbench，这是一个严格且多方面的评估框架，用于合成胸部X光片生成，同时评估了最先进的文本对图像生成模型的保真度，隐私风险和临床实用性。尽管用于现实世界图像的生成AI的快速发展，但医学领域的评估受到方法论上的不一致，过时的结构比较和断开评估标准的阻碍，这些评估标准很少解决合成样本的实际临床价值。 Chexgenbench通过标准化的数据分配和一个统一的评估协议来克服这些局限性，其中包括20个定量指标，这些定量指标可以系统地分析发电质量，潜在的隐私脆弱性以及在11个领先的文本形象到图像架构中的下游临床适用性 ...

0 0 0 0 2025/06/20 arXiv:2505.10496v2 happylittleqiang

Xinyu AI Search: Enhanced Relevance and Comprehensive Results with Rich Answer Presentations

传统的搜索引擎难以合成零散的信息以获取复杂的查询，而生成的AI搜索引擎面临着相关性，全面性和呈现方面的挑战。为了解决这些局限性，我们介绍了Xinyu AI搜索，这是一个新型系统，该系统结合了查询分解图，以动态地将复杂的查询分解为子征服，从而逐步检索和生成。我们的检索管道通过多源集合和查询扩展增强了多样性，同时过滤和重新排序策略优化了通过相关性 ...

0 0 0 0 2025/06/20 arXiv:2505.21849v1 liuweitang