为监督学习获取标签可能会很昂贵。为了提高神经网络回归的样本效率,我们研究了自适应选择批量未标记数据进行标记的主动学习方法。我们提出了一个框架,用于根据(网络相关的)基础内核、内核转换和选择方法构建此类方法 ...

0 0 0 0 2024/07/10 arXiv:2203.09410v4 ifzz

流学习(SL)需要模型快速适应连续数据流,这使其与传统的持续学习(CL)不同。最近的 SL 方法通过选择数据子集进行训练来强调效率,但由于依赖于静态的、基于规则的选择算法,而这些算法无法有效地适应数据重要性的变化,因此它们常常陷入困境。在这项工作中,我们介绍了 StreamPrompt,这是一种通过动态、可学习的提示来增强数据选择的方法 ...

0 0 0 0 2024/07/02 arXiv:2406.07590v1 ifzz

最近,人们对应用大型语言模型(LLM)作为零样本段落排序器越来越感兴趣。然而,很少有研究探索如何为段落排序任务选择合适的上下文演示,这也是本文的重点。之前的研究主要应用演示检索器来检索演示,并使用 top-$k$ 演示进行上下文学习(ICL) ...

0 0 0 0 2024/07/01 arXiv:2406.16332v1 ifzz

现代数据库管理系统 (DBMS) 公开了数百个可配置旋钮来控制系统行为。确定这些旋钮的适当值以提高 DBMS 性能是数据库社区中长期存在的问题。由于需要调整的旋钮数量不断增加,并且每个旋钮都可能是连续值或分类值,因此手动调整变得不切实际 ...

0 0 0 0 2024/07/01 arXiv:2311.03157v1 ifzz

大型语言模型 (LLM) 通过最大限度地减少复杂特征工程的需求,彻底改变了自然语言处理 (NLP)。然而, LLM 在生物制药和化学等专业领域的应用在很大程度上仍未得到探索。这些领域的特点是复杂的术语、专业知识以及对通用 LLM 常常无法满足的精确领域的高要求 ...

0 0 0 0 2024/06/30 arXiv:2406.18045v1 ifzz

从临床和医学影像报告中提取肺部病变信息对于肺部相关疾病的研究和临床护理至关重要。大语言模型 (LLM) 可以有效地解释报告中的非结构化文本,但由于缺乏特定领域的知识,它们经常产生幻觉,导致准确性降低,并对临床环境中的使用提出挑战。为了解决这个问题,我们提出了一个新颖的框架,通过上下文学习(ICL)将生成的内部知识与外部知识结合起来 ...

0 0 0 0 2024/06/30 arXiv:2406.18027v1 ifzz

尽管语言模型(LM)最近取得了进步,但它们解决复杂问题的能力仍然有限。本文介绍了累积推理(CR),这是一种利用 LM 的创新方法进行累积和迭代,反映了人类解决问题的能力CR任务将串联为更小、可思维管理的组件,并利用先前的命题进行有效组合,从而显着增强解决问题的能力... ...

0 0 0 0 2024/10/10 arXiv:2308.04371v6 ifzz

数据库旋钮调整是数据库社区中的一项关键挑战,旨在优化旋钮值以增强特定工作负载的数据库性能。 DBMS 通常具有数百个可调旋钮,这对 DBA 推荐最佳配置提出了重大挑战。因此,人们开发了许多基于机器学习的调整方法来自动化此过程 ...

0 0 0 0 2024/06/27 arXiv:2404.11581v1 ifzz

数据库管理员 (DBA) 在管理、维护和优化数据库系统以确保数据可用性、性能和可靠性方面发挥着至关重要的作用。然而,对于 DBA 来说,管理大量的数据库实例(例如: ...

0 0 0 0 2024/06/27 arXiv:2308.05481v2 ifzz

代码审查是一项有效的软件质量保证活动;然而,这是劳动密集型且耗时的。因此,最近提出了许多基于生成的自动代码审查(ACR)方法,这些方法利用深度学习技术来自动化代码审查过程中的各种活动(例如, ...

0 0 0 0 2024/06/26 arXiv:2303.07221v1 ifzz

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)