近似最近邻搜索 (ANNS) 是信息检索的基本构建模块,基于图形的索引是当前最先进的技术并在行业中广泛使用。基于图的索引的最新进展使得在带有 SSD 的单个商用机器上索引和搜索具有高召回率和毫秒级延迟的十亿点数据集成为可能。然而,现有的 ANNS 图算法仅支持静态索引,无法反映许多关键现实场景(例如,场景)所需的语料库的实时变化 ...
0 0 0 2024/10/22 arXiv:2105.09613v1 3253345336
我们表明,扩散模型可以实现当前最先进的生成模型的图像样本质量。通过我们一系列的消融寻找更好的架构,在无条件图像合成上实现了这个目标。对于图像条件合成,我们通过分类指导器进一步提高样本质量:一种简单、计算的方法,使用分类器的快速来权衡多样性和保真度... ...
0 0 0 2024/10/22 arXiv:2105.05233v4 trenkey
最近的工作表明,要求语言模型生成推理步骤可以提高许多推理任务的性能。当超越提示时,这就提出了我们应该如何监督这些模型的问题:监督最终结果的基于结果的方法,还是监督推理过程本身的基于过程的方法?这些方法之间的差异自然不仅会出现在最终答案错误中,还会出现在推理错误中,这些错误可能很难检测到,并且在教育等许多现实领域中都是有问题的。我们对在自然语言任务 GSM8K 上训练的基于过程和基于结果的方法进行了 ...
0 0 0 2024/10/22 arXiv:2211.14275v1 CCCarloooo
函数调用显着扩展了大型语言模型的应用边界,其中高质量和多样化的训练数据对于解锁此功能至关重要。然而,真正的函数调用数据的收集和注释相当具有挑战性,而现有管道生成的合成数据往往缺乏覆盖范围和准确性。在本文中,我们提出了 ToolACE,这是一种自动代理管道,旨在生成准确、复杂和多样化的工具学习数据 ...
0 0 0 2024/10/22 arXiv:2409.00920v1 jayz.pan
当代主要推荐系统依赖于良好的过滤技术,利用ID嵌入来捕获用户和项目之间的潜在关联。然而,这种方法忽略了项目文本描述中嵌入的丰富语义信息,导致冷启动场景和长尾用户推荐利用在海量语言料库上预训练的大型语言模型(LLM)的功能,为通过集成开放世界领域知识来增强推荐系统提供了一条有前景的途径... ...
0 0 0 2024/10/22 arXiv:2405.03988v1 oscarhscc
预训练的源代码模型在许多代码智能任务中得到了广泛的普及。最近,随着模型和语料库规模的扩展,大型语言模型已经显示出了上下文学习(ICL)的能力。 ICL采用任务指令和一些示例作为演示,然后将演示输入到语言模型中进行预测 ...
0 0 0 2024/10/22 arXiv:2304.07575v2 15673142269
最近,通过重建和生成创建的 3D 资产已与手工制作的资产的质量相匹配,凸显了它们的替代潜力。然而,这种潜力在很大程度上尚未实现,因为这些资产始终需要转换为用于 3D 行业应用的网格,并且当前网格提取方法生成的网格明显不如艺术家创建的网格 (AM),即 ...
0 0 0 2024/10/22 arXiv:2406.10163v2 Donutn
大规模扩散模型在图像生成领域取得了重大进展,特别是通过使用交叉注意机制来指导基于文本描述的图像形成。尽管近年来扩散模型中文本引导交叉注意力的分析已得到广泛研究,但其在图像到图像扩散模型中的应用仍未得到充分探索。本文介绍了图像到图像归因图 I2AM 方法,该方法聚合块级交叉注意力分数,以增强跨时间步长、头部和注意力层的潜在扩散模型的可解释性 ...
0 0 0 2024/10/22 arXiv:2407.12331v1 Alice-mrrrrr

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)