我们在本文中介绍了 SA-DQAS,这是一种新颖的框架,它通过自注意力机制增强了基于梯度的可微分量子架构搜索(DQAS),旨在针对量子机器学习(QML)挑战优化电路设计。类似于句子中的单词序列,量子电路可以被视为包含量子门的占位符序列。与 DQAS 不同,每个占位符都是独立的,而 SA-DQAS 中的自注意力机制有助于捕获电路中占位符上的每个操作候选之间的关系和依赖信息 ...
人际解剖学差异限制了与人无关的凝视估计网络的准确性。然而,有必要进一步降低凝视错误,以实现需要更高质量的应用程序。可以通过个性化凝视网络来实现进一步的收益,理想情况下,很少有校准样本 ...
最近的工作证明了 Transformer 在许多计算机视觉任务中的有效性。但是,凝视估计中 Transformer 的性能仍未开发。在本文中,我们采用 Transformer 并评估其凝视估计的有效性 ...
有效的信息搜索对于增强大语言模型(LLMS)的推理和发电能力至关重要。最近的研究探索了使用强化学习(RL)通过与现实世界环境中的现场搜索引擎进行交互,从而提高了LLM的搜索功能。尽管这些方法显示出令人鼓舞的结果,但它们面临两个主要挑战:(1)不受控制的文档质量:搜索引擎返回的文档质量通常是无法预测的,因此将噪音和不稳定引入培训过程中 ...
虽然大型预训练模型在各种下游任务上取得了令人印象深刻的结果,但最大的现有模型仍然会出错,甚至随着时间的推移,即使准确的预测也可能会过时。由于在训练时检测所有此类故障是不可能的,因此需要使此类模型的开发人员和最终用户能够纠正不准确的输出 ...
本文介绍了pytorch 分布式数据并行模块的设计、实现和评估。 pytorch是一种广泛采用的科学计算包,用于深度学习研究和应用。深度学习的最新进展证明了大型数据集和大型模型的价值,这需要能够将模型训练扩展到更多的计算资源... ...
最近将Pareto Front Learning(PFL)作为一种有效的方法引入,以获取从给定的权衡矢量到Pareto Front上的解决方案,该方法解决了多目标优化(MOO)问题。由于目标相互冲突之间的固有权衡,PFL在许多情况下提供了一种灵活的方法,在许多情况下,决策者无法指定一个帕累托解决方案而不是另一个帕累托解决方案,并且必须根据情况而切换它们。但是,现有的PFL方法忽略了在优化过程中解决 ...
尽管计算机科学在基础模型中取得了显着的进步,但在地球科学中仍然没有得到充实的发展。在解决这一差距的情况下,我们引入了一个工作流程,以开发地球物理基础模型,包括数据准备,模型预训练以及对下游任务的适应性。从192个全球收集的3-D地震量,我们创建了一个经过精心策划的数据集,该数据集为2,286,422 2-D地震图像 ...