尽管联邦学习取得了令人惊叹的进步,但大多数研究都假设客户的数据是完全标记的。然而,在现实场景中,每个客户端都可能有大量未标记的实例。在利用未标记数据的各种方法中,联合主动学习框架已成为一种有前景的解决方案 ...

0 0 0 0 2024/07/26 arXiv:2303.12317v1 ifzz

对大型注释数据集的需求限制了深度卷积神经网络(CNN)在许多实际应用中的使用。这个问题可以通过使用主动学习(AL)技术来缓解,该技术在给定的注释预算下,允许选择在微调时产生最大准确度的数据子集。最先进的 AL 方法通常依赖于视觉多样性或预测不确定性的测量,这无法有效地捕获空间背景的变化 ...

0 0 0 0 2024/07/26 arXiv:2008.05723v1 ifzz

从噪声标记数据中学习对于现实世界的应用至关重要。传统的噪声标签学习(NLL)方法根据训练样本的损失分布将训练数据分类为干净集和噪声集。然而,他们经常忽视干净的样品,尤其是那些具有复杂视觉图案的样品,也可能会产生巨大的损失 ...

0 0 0 0 2024/07/24 arXiv:2407.07331v1 ifzz

有偏见的数据可能会导致不公平的机器学习模型,这凸显了在数据分析开始时嵌入公平性的重要性,特别是在数据集管理和标记期间。作为回应,我们提出了 Falcon,一个可扩展的公平主动学习框架。 Falcon 采用以数据为中心的方法,通过战略样本选择来提高机器学习模型的公平性 ...

0 0 0 0 2024/07/19 arXiv:2401.12722v2 ifzz

增量视图维护长期以来一直是数据库理论的中心问题。针对有限类别的数据库语言(例如关系代数或 Datalog),提出了许多解决方案。这些技术并不能自然地推广到更丰富的语言 ...

0 0 0 0 2024/07/18 arXiv:2203.16684v1 ifzz

精心选择的物化视图可以极大地提高 OLAP 工作负载的性能。我们研究使用深度强化学习来学习自适应视图物化和驱逐策略。我们的见解是,可以使用异步强化学习算法有效地训练此类选择策略,该算法在系统空闲时间运行配对的反事实实验,以评估保留某些视图的增量价值 ...

0 0 0 0 2024/07/18 arXiv:1903.01363v1 ifzz

为了实现高效的查询处理,DBMS 查询优化器几十年来一直依赖于精细的基数估计方法。在这项工作中,我们提出了一种用于 SPJ 查询的基于注意力的学习基数估计器(简称 ALECE)。核心思想是使用 ALECE 两个模块中的注意力机制来发现查询和底层动态数据之间的隐式关系,这两个模块构建在精心设计的数据和查询特征之上 ...

0 0 0 0 2024/07/18 arXiv:2310.05349v3 ifzz

由于基础数据的偏差,决策系统中使用的排名函数通常会针对不同人群产生不同的结果。解决并补偿这些不同的结果是公平决策的关键问题。最近的补偿措施主要集中在排名功能的不透明转变上,以满足公平保证,或使用配额或预留款来保证代表性不足群体成员获得最低数量的积极成果 ...

0 0 0 0 2024/07/18 arXiv:2307.14366v2 ifzz

各种工作都利用深度强化学习(DRL)来解决数据库系统中的查询优化问题。他们要么学习以自下而上的方式从头开始构建计划,要么使用提示指导传统优化器的计划生成行为。虽然这些方法取得了一些成功,但它们面临着训练效率低或计划搜索空间有限的挑战 ...

0 0 0 0 2024/07/18 arXiv:2312.06357v1 ifzz

多领域假新闻检测旨在识别来自不同领域的各种新闻的真假,变得紧迫而重要。然而,现有的方法致力于提高假新闻检测的整体性能,忽略了数据不平衡导致不同领域的区别对待的事实,即 ...

0 0 0 0 2024/07/18 arXiv:2312.01006v1 ifzz

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)