arxiv的文档

arxiv 南京

个性签名 ...

Reasoning RAG via System 1 or System 2: A Survey on Reasoning Agentic Retrieval-Augmented Generation for Industry Challenges

通过将外部检索与语言生成整合在一起，可以作为一个有力的框架来克服大型语言模型（LLMS）的知识限制。尽管基于静态管道的早期抹布系统在结构良好的任务中显示出有效性，但它们在现实的场景中挣扎，需要复杂的推理，动态检索和多模式集成。为了应对这些挑战，该领域已转向推理代理抹布，这是一种将决策和自适应工具直接使用到检索过程中的范式 ...

0 0 0 0 2025/07/23 arXiv:2506.10408v1 jjjkkyz

AgentCPM-GUI: Building Mobile-Use Agents with Reinforcement Fine-Tuning

大型语言模型代理的最新进展为通过图形用户界面（GUI）自动化任务开辟了新的可能性，尤其是在智能互动可以大大提高可用性的移动环境中。但是，这种代理的实际部署仍受到几个关键挑战的限制。现有的培训数据通常是嘈杂的，缺乏语义多样性，这阻碍了学习精确的基础和计划 ...

0 0 0 0 2025/07/23 arXiv:2506.01391v2 pkayzhang

Instance-wise Occlusion and Depth Orders in Natural Scenes

在本文中，我们介绍了一个名为Instaorder的新数据集，该数据集可用于了解图像中实例的几何关系。该数据集由101K自然场景中的类标记实例的几何顺序注释 ...

0 0 0 0 2025/07/23 arXiv:2111.14562v3 wonglliam

SceneDiffuser++: City-Scale Traffic Simulation via a Generative World Model

交通模拟的目的是增加可用于测试和验证的可能有限的手动驱动里程，并使用大量的模拟合成里程。这种愿景的高潮将是一个生成的模拟城市，鉴于该城市的地图和自动驾驶汽车（AV）软件堆栈，模拟器可以通过填充AV周围的城市并控制场景的所有方面，从动画动态（例如 ...

0 0 0 0 2025/07/23 arXiv:2506.21976v1 zlheos

CogDDN: A Cognitive Demand-Driven Navigation with Decision Optimization and Dual-Process Thinking

在未知和非结构化环境中浏览和互动以满足人类需求，越来越多地需要移动机器人。需求驱动的导航（DDN）使机器人能够基于隐式人类意图识别和定位对象，即使对象位置未知。但是，传统数据驱动的DDN方法依赖于预采用的数据进行模型培训和决策，从而限制了它们在看不见的情况下的概括能力 ...

0 0 0 0 2025/07/23 arXiv:2507.11334v1 bb2234

VIRT: Improving Representation-based Models for Text Matching through Virtual Interaction

随着预训练的 Transformer 的蓬勃发展，基于暹罗 Transformer 编码器的表示基于表示的模型已成为有效文本匹配的主流技术。但是，与基于相互作用的模型相比，由于文本对之间缺乏相互作用，这些模型由于缺乏相互作用而遭受严重的性能下降。先前的艺术试图通过对暹罗编码表示形式执行额外的互动来解决此问题，而编码过程中的交互仍然被忽略 ...

0 0 0 0 2025/07/23 arXiv:2112.04195v3 snowpigppp

LLM-Guided Search for Deletion-Correcting Codes

查找最大尺寸的删除校正代码已在70多年的时间内一直是一个空旷的问题，即使是单个删除也是如此。在本文中，我们提出了一种构建缺失校正代码的新方法。代码是满足某些约束的一组序列，我们通过根据优先级函数添加最高优先级序列来构造它 ...

0 0 0 0 2025/07/23 arXiv:2504.00613v1 menghuaz

The Tenth NTIRE 2025 Image Denoising Challenge Report

本文概述了NTIRE 2025图像Denoising挑战（{\ sigma} = 50）的概述，突出了所提出的方法和相应的结果。主要目的是开发能够实现高质量降解性能的网络体系结构，并使用PSNR进行了定量评估，而没有对计算复杂性或模型大小的限制。该任务假设具有固定噪声水平为50的独立添加剂白色高斯噪声（AWGN） ...

0 0 0 0 2025/07/23 arXiv:2504.12276v1 oldwound

Temporal Relation Extraction in Clinical Texts: A Span-based Graph Transformer Approach

从非结构化文本中提取的时间信息对于上下文化事件和得出可行的见解至关重要，尤其是在医学领域中。我们使用经过良好研究的I2B2 2012临时关系挑战语料库提取临床事件及其时间关系的任务。由于复杂的临床语言，长文档和稀疏注释，此任务本质上是具有挑战性的 ...

0 0 0 0 2025/07/23 arXiv:2503.18085v2 DUNK_911

SurfaceSplat: Connecting Surface Reconstruction and Gaussian Splatting

从稀疏视图图像中呈现的表面重建和新型视图构成具有挑战性。签名的距离函数（SDF）的方法与细节相处，而3D高斯（3DGS）基于3D的方法则缺乏全局几何形状相干性。我们提出了一种新型的混合方法，结合了两种方法的优势：SDF捕获粗几何形状以增强基于3DGS的渲染，而来自3DGS的新渲染图像则完善了SDF的细节以进行准确的表面重建 ...

0 0 0 0 2025/07/23 arXiv:2507.15602v1 小小卡拉米