arxiv的文档

arxiv 南京

个性签名 ...

Tree-Based Text Retrieval via Hierarchical Clustering in RAGFrameworks: Application on Taiwanese Regulations

传统的检索演奏生成（RAG）系统采用蛮力内部产品搜索来检索最类似的文档，然后与用户查询结合并传递给语言模型。这使模型可以访问外部知识并减少幻觉。但是，选择适当的k值仍然是实际应用中的重大挑战：小k可能无法检索足够的信息，而大k可以引入过度和无关紧要的内容 ...

0 0 0 0 2025/07/04 arXiv:2506.13607v1 moshmode

EraRAG: Efficient and Incremental Retrieval Augmented Generation for Growing Corpora

基于图的检索效果生成（Graph-rag）通过在外部语料库上进行检索来增强大语言模型（LLMS）。但是，现有方法通常假设静态语料库，每当新文档到达时，都需要昂贵的全部重建，从而限制了它们在动态，不断发展的环境中的可扩展性。为了解决这些局限性，我们介绍了Erarag，这是一种新型的多层图形抹布框架，支持有效且可扩展的动态更新 ...

0 0 0 0 2025/07/04 arXiv:2506.20963v1 moshmode

Robust Key-Frame Stereo Visual SLAM with low-threshold Point and Line Features

在本文中，我们开发了一个强大，有效的视觉大满贯系统，该系统利用了低阈值，基线线和闭环钥匙帧功能的空间抑制。使用ORB-SLAM2，我们的方法包括立体声匹配，框架跟踪，本地捆绑包调整以及线和点全局束调整。特别是，我们根据基线贡献了重新注射 ...

0 0 0 0 2025/07/04 arXiv:2207.05244v1 康康23

Graph Information Bottleneck for Subgraph Recognition

鉴于输入图及其标签/属性，图形学习的几个关键问题，例如查找可解释的子图，图形降解和图形压缩，可以归因于识别原始图的子图的基本问题。该子图应尽可能提供信息，但包含冗余和嘈杂的结构。此问题设置与众所周知的信息瓶颈（IB）原理密切相关，但是，对于不规则的图形数据和图形神经网络（GNNS），研究较少研究 ...

0 0 0 0 2025/07/04 arXiv:2010.05563v1 QingXiang

"Oh LLM, I'm Asking Thee, Please Give Me a Decision Tree": Zero-Shot Decision Tree Induction and Embedding with Large Language Models

大型语言模型（LLMS）提供了强大的手段，以利用先验知识在数据有限时进行预测建模。在这项工作中，我们演示了LLM如何使用其压缩世界知识来生成本质上可解释的机器学习模型，即 ...

0 0 0 0 2025/07/04 arXiv:2409.18594v2 waterfall666

Why Distillation can Outperform Zero-RL: The Role of Flexible Reasoning

强化学习（RL）在提高大语言模型（LLM）的推理能力方面发挥了重要作用。一些研究将RL直接应用于\ textIt {较小}基本模型（称为零RL），并且还取得了显着的进步。但是，在本文中，我们表明，仅使用920个示例，基于基本模型的简单蒸馏方法可以清楚地超过零RL，通常需要更多的数据和计算成本 ...

0 0 0 0 2025/07/04 arXiv:2505.21067v1 sue

Enhancing Visual Grounding for GUI Agents via Self-Evolutionary Reinforcement Learning

图形用户界面（GUI）代理在理解和执行不同平台的用户指令方面取得了长足的进步。然而，将这些说明扎根于精确的界面元素仍然具有挑战性，尤其是在复杂，高分辨率，专业环境中。传统的监督芬特（SFT）方法通常需要大量不同的数据，并且表现出较弱的概括 ...

0 0 0 0 2025/07/04 arXiv:2505.12370v2 qwqw7878asas

Who Wrote This? The Key to Zero-Shot LLM-Generated Text Detection Is GECScore

检测器对大语模型（LLM）产生的文本的功效很大程度上取决于大规模培训数据的可用性。但是，不需要此类数据的白盒零射击检测器受到LLM生成文本源模型的可访问性的限制。在本文中，我们提出了一种基于这样的观察结果，即从LLM的角度来看，人写的文本通常包含比LLM生成的文本更多的语法错误 ...

0 0 0 0 2025/07/04 arXiv:2405.04286v2 15611250722

Beyond the Nav-Graph: Vision-and-Language Navigation in Continuous Environments

我们在连续的3D环境中开发了一个语言引导的导航任务，代理必须执行低级操作以遵循自然语言导航方向。通过位于连续的环境中，此设置可以提取以前工作中隐含的许多假设，这些假设将环境表示为稀疏的全景图，边缘具有与导航性相对应的边缘。具体而言，我们的设置丢弃了已知的环境拓扑，短距离甲骨文导航和完美代理定位的推定 ...

0 0 0 0 2025/07/04 arXiv:2004.02857v2 Alice_ly

Logic and Commonsense-Guided Temporal Knowledge Graph Completion

时间知识图（TKG）存储从涉及时间的数据中得出的事件。由于事件的时间敏感性，预测事件极具挑战性。此外，先前的TKG完成（TKGC）方法不能同时代表事件的及时性和因果关系 ...

0 0 0 0 2025/07/04 arXiv:2211.16865v2 aaatuzi