序列到序列学习的流行方法通过循环神经网络将输入序列映射到可变长度输出序列。我们引入了一种完全基于卷积神经网络的架构。与循环模型相比,所有元素的计算在训练期间可以完全并行化,并且优化更容易,因为非线性的数量是固定的并且与输入长度无关 ...
0 0 0 2024/04/21 arXiv:1705.03122v3 chang904105072
检索增强生成 (RAG) 是一种流行的方法,将文档的私有知识库与大型语言模型 (LLM) 相结合,以构建生成式 Q\&A(问答)系统。然而,随着文档语料库规模的扩大,RAG 准确性变得越来越具有挑战性,检索器通过从语料库中提取最相关的文档为 LLM 提供上下文,在整体 RAG 准确性中发挥着巨大的作用。在本文中,我们提出了利用语义搜索技术(例如密集向量索引和稀疏编码器索引)与混合查询策略混合的“混 ...
0 0 1 2024/04/21 arXiv:2404.07220v1 leoleoleo
本调查论文研究了人工智能代理实现的最新进展,重点关注它们实现需要增强推理、规划和工具执行能力的复杂目标的能力。这项工作的主要目标是 a) 传达现有 AI 代理实现的当前功能和局限性,b) 分享我们从对这些系统实际运行的观察中获得的见解,以及 c) 为 AI 代理设计的未来发展提出重要考虑因素。我们通过提供单代理和多代理架构的概述、识别设计选择中的关键模式和分歧以及评估它们对实现所提供目标的总体影响 ...
0 0 0 2024/04/21 arXiv:2404.11584v1 liuguan
我们引入了 Zero-1-to-3,这是一个框架,用于在给定单个 RGB 图像的情况下更改对象的相机视角。为了在这种约束条件下执行新颖的视图合成,我们利用大规模扩散模型了解自然图像的几何先验。我们的条件扩散模型使用合成数据集来学习相对相机视点的控制,这允许在指定的相机变换下生成同一对象的新图像 ...
0 0 0 2024/04/21 arXiv:2303.11328v1 li934038421
随着快速发展的机器学习领域不断产生非常有用的工具和模型,量子计算为机器学习算法提供加速的潜力变得越来越令人渴望。特别是,正在研究用量子电路代替经典卷积滤波器来执行基于图像检测的任务,以发挥量子优势的能力。然而,这些被称为量子卷积神经网络(QCNN)的尝试缺乏有效处理多通道数据的能力,因此仅限于相对简单的输入 ...
0 0 0 2024/04/20 arXiv:2305.18961v2 oracle
检测有益的特征交互在推荐系统中至关重要,现有方法通过检查所有可能的特征交互来实现这一点。然而,检查所有可能的高阶特征交互的成本是令人望而却步的(随着阶数的增加呈指数增长)。因此,现有的方法只能检测有限的顺序(例如 ...
0 0 0 2024/04/20 arXiv:2206.13764v1 wuyang.a
经过弱注释训练的对象检测器是完全监督的对象检测器的经济替代品。然而,它们之间仍然存在显着的性能差距。我们建议通过使用“box-in-box”(BiB)(一种新颖的主动学习)从训练集中自动选择一些完全注释的样本来微调基本的预训练弱监督检测器来缩小这一差距专门为解决弱监督探测器的有据可查的故障模式而设计的策略 ...
0 0 0 2024/04/20 arXiv:2207.12112v1 hzl
我们描述了一种面向任务的对话方法,其中对话状态表示为数据流图。对话代理将每个用户话语映射到扩展该图的程序。程序包括用于参考和修订的元计算运算符,它们重用前一轮的数据流片段 ...
0 0 0 2024/04/20 arXiv:2009.11423v3 robot

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)