ifzz的文档

ifzz

个性签名 ...

Text-to-Pipeline: Bridging Natural Language and Data Preparation Pipelines

数据制备（DP）将原始数据转换为适合下游应用程序的形式，通常是通过将操作组合到可执行管道中。构建这样的管道是耗时的，需要精致的编程技能。如果我们可以使用自然语言（NL）构建管道，那么DP的技术障碍将大大降低 ...

0 0 0 0 2025/07/07 arXiv:2505.15874v1 ifzz

Leveraging Large Language Model for Intelligent Log Processing and Autonomous Debugging in Cloud AI Platforms

随着云平台中AI系统规模的复杂性和快速扩展，系统操作过程中生成的日志数据是巨大的，非结构化的和语义上模棱两可的，这给故障位置和系统自我修复带来了巨大的挑战。为了解决此问题，本文提出了一个智能日志处理和基于大语言模型（LLM）的自动调试框架，该框架为智能调试器（LLM-ID）。该方法是根据现有的预训练 Transformer 模型扩展的，并集成了多阶段的语义推理机制，以实现对系统日志的上下文理解和故障链的自动重建 ...

0 0 0 0 2025/06/30 arXiv:2506.17900v1 ifzz

ETrace:Event-Driven Vulnerability Detection in Smart Contracts via LLM-Based Trace Analysis

随着区块链技术在各个领域的提前应用，确保智能合约的安全性和稳定性已成为一个关键挑战。当前的脆弱性检测方法中的当前安全分析方法可以分为静态分析和动态分析，这些HTTP URL这些现有的传统脆弱性检测方法主要依赖于分析原始合同代码，并非所有智能合约都可以访问此http url thttp URL当前的ETRACE，这是一个新的事件驱动的脆弱性检测框架，从而通过智能检测框架来识别智能框架，从而使智能框架识别出智能框架，这是在智能框架中识别的，这是smart nose的范围，这是smart nose syperife s ll lll a n ll ll lll nll nll syperifife a源代码访问。通过从交易日志中提取细粒度的事件序列，该框架利用大型语言模型（LLMS）作为自适应语义解释者，通过经过思考的推理来重建事件分析 ...

0 0 0 0 2025/06/30 arXiv:2506.15790v1 ifzz

Automated Query-Product Relevance Labeling using Large Language Models for E-commerce Search

准确的查询产品相关性标签是必不可少的，以生成地面真相数据集以用于电子商务中的搜索排名。注释查询产品对的传统方法依赖于基于人类的标签服务，这是昂贵，耗时且容易出现错误的标签服务。在这项工作中，我们探讨了大型语言模型（LLM）的应用，以自动化查询产品相关性标签，以进行大规模的电子商务搜索 ...

0 0 0 0 2025/06/27 arXiv:2502.15990v1 ifzz

Lightweight Relevance Grader in RAG

通过利用矢量数据库提供更准确和最新的信息来解决大语言模型（LLMS）的局限性。当用户提交查询时，RAG执行矢量搜索以查找相关文档，然后将其用于生成响应。但是，确保与查询检索文件的相关性将是一个巨大的挑战 ...

0 0 0 0 2025/06/23 arXiv:2506.14084v1 ifzz

RAGentA: Multi-Agent Retrieval-Augmented Generation for Attributed Question Answering

我们介绍了Ragenta，这是一个多代理检索型生成一代（RAG）归因性答案（QA）的框架。以值得信赖的答案产生的目标，拉根塔（Ragenta）专注于优化答案正确性，这是由覆盖范围和与问题和忠诚相关的相关性定义的，这衡量了在检索文件中基于的答案的程度。 Ragenta使用的是迭代过滤的多代理体系结构，以在线引用中生成归因的答案，并通过动态改进来验证完整性 ...

0 0 0 0 2025/06/23 arXiv:2506.16988v1 ifzz

CellAgent: An LLM-driven Multi-Agent Framework for Automated Single-cell Data Analysis

单细胞RNA测序（SCRNA-SEQ）数据分析对于生物学研究至关重要，因为它可以精确地表征细胞异质性。但是，手动操纵各种工具以实现预期的结果可能是研究人员的劳动密集型。为了解决这个问题，我们介绍了Cellagent（此HTTP URL），这是一个由LLM驱动的多代理框架，专为SCRNA-SEQ数据分析任务的自动处理和执行而设计，在没有人类干预的情况下提供了高质量的结果 ...

0 0 0 0 2025/06/19 arXiv:2407.09811v1 ifzz

Database Workload Characterization with Query Plan Encoders

智能数据库正在采用人工智能（AI）技术来实现{\ em实例最佳性}，将来，数据库将随着其核心组件中的预包装AI模型提供。原因是每个数据库都在不同的工作负载上运行，需要特定的资源和设置以实现最佳性能。它促使有必要了解系统中运行的工作负载及其全面功能，我们将其视为工作负载表征 ...

0 0 0 0 2025/06/09 arXiv:2105.12287v1 ifzz

Learned Indexes for Dynamic Workloads

最新的学习指数结构的提案为如何优化传统范围索引提供了新的观点。但是，当前学习的索引假设数据分布相对静态，并且访问模式是统一的，而现实世界的场景由偏斜的查询分布和不断发展的数据组成。在本文中，我们证明了对访问模式和动态数据分布的缺失特别阻碍了学习索引的适用性 ...

0 0 0 0 2025/06/09 arXiv:1902.00655v1 ifzz

Learned Cardinalities: Estimating Correlated Joins with Deep Learning

我们描述了一种新的深度学习方法来估计基数。 MSCN是一个多组的卷积网络，量身定制为代表关系查询计划，它采用设定的语义来捕获查询功能和真正的红衣主教。 MSCN建立在基于抽样的估计的基础上，当没有采样元素符合谓词并捕获结合跨相关性时，解决了其弱点 ...

0 0 0 0 2025/06/09 arXiv:1809.00677v2 ifzz