ifzz的文档

ifzz

个性签名 ...

PURPLE: Making a Large Language Model a Better SQL Writer

大型语言模型 (LLM) 技术在自然语言到 SQL (NL2SQL) 的翻译中发挥着越来越重要的作用。经过广泛语料库训练的 LLM 具有很强的自然语言理解能力和基本的 SQL 生成能力，无需针对 NL2SQL 任务进行额外的调整。现有的基于 LLM 的 NL2SQL 方法试图通过增强 LLM 来改进翻译，重点是用户意图理解 ...

0 0 0 0 2024/04/07 arXiv:2403.20014v1 ifzz

Real-Time Analytics by Coordinating Reuse and Work Sharing

分析工具通常需要对高度并发的参数化工作负载进行实时响应。常见的解决方案是使用具体化子表达式来回答查询，从而减少运行时的处理。然而，由于查询仍然是单独处理的，并发未完成的计算会累积并增加响应时间 ...

0 0 0 0 2024/04/06 arXiv:2307.08018v1 ifzz

MOCAS: A Multimodal Dataset for Objective Cognitive Workload Assessment on Simultaneous Tasks

本文介绍了 MOCAS，这是一个专用于人类认知工作量（CWL）评估的多模式数据集。与基于虚拟游戏刺激的现有数据集相比，MOCAS 中的数据是从现实的闭路电视 (CCTV) 监控任务中收集的，增加了其对现实场景的适用性。为了构建 MOCAS，使用了两个现成的可穿戴传感器和一个网络摄像头来收集 21 名人类受试者的生理信号和行为特征 ...

0 0 0 0 2024/04/06 arXiv:2210.03065v1 ifzz

Efficient Joinable Table Discovery in Data Lakes: A High-Dimensional Similarity-Based Approach

在数据湖中查找可连接的表是许多应用程序（例如数据集成、数据增强、数据分析和数据市场）中的关键过程。查找可等连接表的传统方法无法处理拼写错误和不同格式，也无法捕获任何语义连接。在本文中，我们提出了 PEXESO，一个用于数据湖中可连接表发现的框架 ...

0 0 0 0 2024/04/03 arXiv:2010.13273v4 ifzz

Using ChatGPT for Entity Matching

实体匹配是确定两个实体描述是否引用同一现实世界实体的任务。最先进的实体匹配方法通常依赖于微调 Transformer 模型，例如 BERT 或 RoBERTa。使用这些模型进行实体匹配的两个主要缺点是：（i）模型需要大量的微调数据才能达到良好的性能；（ii）微调模型对于分布外实体而言并不稳健 ...

0 0 0 0 2024/03/27 arXiv:2305.03423v2 ifzz

Federated Recommendation with Additive Personalization

通过联邦学习（ fl）构建推荐系统是推进下一代互联网服务和隐私保护的新挑战。现有方法通过fl训练共享项目嵌入，同时保持用户嵌入在客户端的私密性。然而，为所有客户端嵌入相同，为所有客户端嵌入相同的项目无法捕获用户感知同一项目的个体差异，从而导致个性化较差... ...

0 1 0 0 2025/02/26 arXiv:2301.09109v4 ifzz

FinSQL: Model-Agnostic LLMs-based Text-to-SQL Framework for Financial Analysis

文本到SQL提供操作数据库的零代码接口，在金融分析领域严肃关注；因为，金融专业人士可能不擅长SQL编程。然而，无论如何，还没有用于金融分析的实用文本- to-SQL基准数据集，而现有的文本到SQL方法没有考虑金融应用中数据库的独特特征，例如常见的宽表。为了解决这些问题，我们收集了一个实用的文本到SQL基准数据集，并提出了一个与模型相关的基于大型语言模型（LLM） SQL 财务分析框架的文本... ...

0 0 0 0 2025/01/15 arXiv:2401.10506v1 ifzz

C3: Zero-shot Text-to-SQL with ChatGPT

本文提出了一种基于chatgpt的零样本文本到sql方法，称为c3，spider的蜘蛛的保留测试集上执行准确率达到82.3％，spider挑战中的文本到sql方法。c3 c3由三个关键部分组成：cp）（cp）（cp）（CO）（CO）（CO）（CO）（CO），分别对应模型输入、模型偏差和模型输出 ...

0 0 0 0 2025/03/08 arXiv:2307.07306v1 ifzz

Semi-supervised Domain Adaptation in Graph Transfer Learning

作为图迁移学习的一个具体案例，图上的无监督域适应旨在将知识从富含标签的源图转移到未标记的目标图。然而，具有拓扑和属性的图通常具有相当大的跨域差异，并且在许多现实场景中，源图中仅标记了节点的子集。由于严重的领域转移和标签稀缺，这给图迁移学习带来了严峻的挑战 ...

0 0 0 0 2024/03/07 arXiv:2309.10773v1 ifzz

Sibyl: Forecasting Time-Evolving Query Workloads

数据库系统通常依赖历史查询跟踪来执行基于工作负载的性能调整。然而，实际生产工作负载是随时间变化的，使得历史查询对于优化未来工作负载无效。为了应对这一挑战，我们提出了sibyl，这是一种基于端到端机器学习的框架 ...

0 0 0 0 2025/04/28 arXiv:2401.03723v1 ifzz