liuweitang的文档

On Data Engineering for Scaling LLM Terminal Capabilities

尽管大型语言模型的终端能力最近取得了快速进展，但最先进的终端代理背后的训练数据策略在很大程度上仍未公开。我们通过对终端代理的数据工程实践进行系统研究来解决这一差距，做出了两个关键贡献：（1）Terminal-Task-Gen，一种轻量级合成任务生成管道，支持基于种子和基于技能的任务构建；（2）对数据和训练策略的全面分析，包括过滤、课程学习、长上下文训练和扩展行为。我们的管道产生了 Terminal-Corpus，这是一个用于终端任务的大规模开源数据集。使用此数据集，我们训练 Nemotron-Terminal，这是从 Qwen3（8B、14B、32B）初始化的一系列模型，在 Terminal-Bench 2.0 上取得了显着的进步：Nemotron-Terminal-8B 从 2.5% 提高到 13.0%，Nemotron-Terminal-14B 从 4.0% 提高到 20.2%，Nemotron-Terminal-32B 从 3.4% 提高达到 27.4%，与更大型号的性能相当。为了加速该领域的研究，我们在此 https URL 开源了我们的模型检查点和大部分合成数据集 ...

0 0 0 0 2026/02/25 arXiv:2602.21193v1 liuweitang

Xinyu AI Search: Enhanced Relevance and Comprehensive Results with Rich Answer Presentations

传统的搜索引擎难以合成零散的信息以获取复杂的查询，而生成的AI搜索引擎面临着相关性，全面性和呈现方面的挑战。为了解决这些局限性，我们介绍了Xinyu AI搜索，这是一个新型系统，该系统结合了查询分解图，以动态地将复杂的查询分解为子征服，从而逐步检索和生成。我们的检索管道通过多源集合和查询扩展增强了多样性，同时过滤和重新排序策略优化了通过相关性 ...

0 0 0 0 2025/06/20 arXiv:2505.21849v1 liuweitang

Fine-tuning large language models for domain adaptation: Exploration of training strategies, scaling, model merging and synergistic capabilities

材料科学和工程等领域应用领域应用的大型语言模型（LLM）的进步取决于制定适应专业技术能力的微调策略。在这项工作中，我们探讨了持续预处理（CPT），监督微调（SFT）以及各种基于偏好的优化方法，包括直接偏好优化（DPO）和优势比偏好优化（ORPO）对微型LLM绩效的影响。我们的分析表明，这些策略如何影响模型的结果，并揭示了多个微调模型的合并可以导致超过父模型的个人贡献的能力的出现 ...

0 0 0 0 2025/06/20 arXiv:2409.03444v1 liuweitang

Graphiti: Bridging Graph and Relational Database Queries

本文提出了一种自动推理技术，用于检查用Cypher编写的图形数据库查询与SQL中的关系查询之间的等效性。为了在这种情况下形式化适当的等价概念，我们介绍了数据库 Transformer 的概念，该概念在图和关系模型之间转换数据库实例。然后，我们提出了一种新颖的验证方法，该方法可以通过减少原始问题来验证一对SQL查询之间的等效性来检查给定的 Transformer ...

0 0 0 0 2025/06/19 arXiv:2504.03182v1 liuweitang

When to use Graphs in RAG: A Comprehensive Analysis for Graph Retrieval-Augmented Generation

Graph检索效果生成（GraphRag）已成为具有外部知识增强大型语言模型（LLM）的强大范式。它利用图形来对特定概念之间的层次结构进行建模，从而使更连贯和有效的知识检索能够准确地进行此HTTP URL的概念上的承诺，最近的研究报告说，GraphRag经常在许多现实世界任务上表现不佳。这提出了一个关键的问题：GraphRag真的有效吗？在哪些情况下，图形结构为抹布系统提供了可衡量的好处？为了解决这个问题，我们提出了GraphRag-Bench，这是一个综合基准测试，旨在评估GraphRag模型的分层知识检索和深层上下文推理 ...

0 1 0 0 2025/06/19 arXiv:2506.05690v1 liuweitang

On Data Engineering for Scaling LLM Terminal Capabilities

Xinyu AI Search: Enhanced Relevance and Comprehensive Results with Rich Answer Presentations

Fine-tuning large language models for domain adaptation: Exploration of training strategies, scaling, model merging and synergistic capabilities

Graphiti: Bridging Graph and Relational Database Queries

When to use Graphs in RAG: A Comprehensive Analysis for Graph Retrieval-Augmented Generation

GraphGen: Enhancing Supervised Fine-Tuning for LLMs with Knowledge-Driven Synthetic Data Generation

ROGRAG: A Robustly Optimized GraphRAG Framework

Not All Votes Count! Programs as Verifiers Improve Self-Consistency of Language Models for Math Reasoning

SPEED-RL: Faster Training of Reasoning Models via Online Curriculum Learning

Intuitionistic Fuzzy Sets for Large Language Model Data Annotation: A Novel Approach to Side-by-Side Preference Labeling