whyseu的文档

whyseu

个性签名 ...

Efficient Prompting Methods for Large Language Models: A Survey

提示已成为使大型语言模型（LLM）适应特定自然语言处理任务的主流范例。虽然这种方法为 LLM 的上下文学习打开了大门，但它带来了模型推理的额外计算负担和手动设计提示的人力，特别是在使用冗长而复杂的提示来指导和控制 LLM 的行为时。因此， LLM 领域的有效激励方法显着激增 ...

0 0 0 0 2024/04/03 arXiv:2404.01077v1 whyseu

A Survey on Multilingual Large Language Models: Corpora, Alignment, and Bias

在大语言模型（LLM）的基础上，开发了多语言大语言模型（MLLM）来解决多语言自然语言处理任务的挑战，希望实现从高资源语言到低资源语言的知识迁移。然而，仍然存在重大限制和挑战，例如语言不平衡、多语言对齐和固有偏见。在本文中，我们的目标是对 MLLM 进行全面分析，深入探讨围绕这些关键问题的讨论 ...

0 0 0 0 2024/04/03 arXiv:2404.00929v1 whyseu

PLOG: Table-to-Logic Pretraining for Logical Table-to-Text Generation

逻辑表到文本生成是一项涉及从表生成逻辑上忠实的句子的任务，这需要模型通过逻辑推理从表记录中导出逻辑级事实。它对表到文本模型的逻辑层内容规划提出了新的挑战。然而，由于自然语言的歧义性和并行数据的稀缺性，直接从表文本对中学习逻辑推理知识对于神经模型来说非常困难 ...

0 0 0 0 2024/03/29 arXiv:2205.12697v2 whyseu

Exploring the Impact of Table-to-Text Methods on Augmenting LLM-based Question Answering with Domain Hybrid Data

使用特定领域数据增强用于问答 (QA) 的大型语言模型 (LLM) 已引起广泛关注。然而，领域数据通常以混合格式存在，包括文本和半结构化表格，这给信息的无缝集成带来了挑战。表到文本生成是一种很有前途的解决方案，它可以促进混合数据转换为统一文本格式的语料库 ...

0 0 0 0 2024/03/28 arXiv:2402.12869v1 whyseu

Data Mixing Laws: Optimizing Data Mixtures by Predicting Language Modeling Performance

大型语言模型的预训练数据由多个领域（例如网络文本、学术论文、代码）组成，其混合比例对结果模型的能力至关重要 ...

0 0 0 0 2024/03/26 arXiv:2403.16952v1 whyseu

Are we there yet? An Industrial Viewpoint on Provenance-based Endpoint Detection and Response Tools

基于来源的端点检测和响应 (P-EDR) 系统被认为对于未来 APT 防御至关重要。尽管学术界已经提出了许多改进P-EDR系统的新技术，但仍不清楚业界是否会采用P-EDR系统以及业界希望P-EDR系统进行哪些改进。为此，我们对 P-EDR 系统的有效性和局限性进行了第一组系统研究 ...

0 0 0 0 2024/03/26 arXiv:2307.08349v1 whyseu

From Pixels to Insights: A Survey on Automatic Chart Understanding in the Era of Large Foundation Models

图表形式的数据可视化在数据分析中发挥着关键作用，提供重要的见解并帮助做出明智的决策。近年来，随着大型基础模型的兴起，自动图表理解取得了显着进步。基础模型，例如大语言模型（LLM），已经彻底改变了各种自然语言处理（NLP）任务，并且越来越多地应用于图表理解任务 ...

0 0 0 0 2024/03/22 arXiv:2403.12027v1 whyseu

Table-GPT: Table-tuned GPT for Diverse Table Tasks

GPT-3.5 和 ChatGPT 等语言模型展示了遵循不同人类指令并执行各种任务的卓越能力。然而，当使用一系列基本的表格理解任务探索语言模型时，我们观察到当今的语言模型在许多与表格相关的任务中仍然不是最优的，可能是因为它们主要是在\emph{一维}上进行预训练的自然语言文本，而关系表是\emph{二维}对象 ...

0 0 0 0 2024/03/30 arXiv:2310.09263v1 whyseu

Data Filtering Networks

大型训练集已成为机器学习的基石，也是语言建模和多模态学习最新进展的基础。虽然预训练的数据管理通常仍然是临时的，但一种常见的范例是首先从网络收集大量数据，然后通过各种启发式方法将该候选池过滤为实际的训练集。在这项工作中，我们研究了学习数据过滤网络（DFN）的问题，以用于过滤大型未整理数据集的第二步 ...

0 0 0 0 2024/03/18 arXiv:2309.17425v3 whyseu

VeCLIP: Improving CLIP Training via Visual-enriched Captions

大规模网络爬取数据集是预训练视觉语言模型（例如 CLIP）成功的基础。然而，网络抓取的 AltText 固有的噪声和潜在的不相关性给实现精确的图像文本对齐带来了挑战。利用大型语言模型 (LLM) 进行字幕重写的现有方法已在 CC3M 和 CC12M 等小型精选数据集上显示出前景 ...

0 0 0 0 2024/03/17 arXiv:2310.07699v3 whyseu