虽然在广泛的任务中取得了显着的进展,但大型语言模型(LLM)在正确使用大量外部工具方面仍然受到严重限制。现有的情境学习方法只是将工具格式化为纯文本描述列表,并将其输入到 LLM , LLM 从中生成一系列工具调用来逐步解决问题。这种范式忽略了工具之间的内在依赖性,并将所有推理负载卸载给 LLM ,使它们仅限于有限数量的专门设计的工具 ...

0 0 0 0 2024/09/20 arXiv:2403.00839v1 mmShen

库迁移,即通过使用不同的库而不是当前的库来重新实现相同的软件行为,在软件演化中已被广泛观察到。库迁移的一个重要部分是找到一个可以提供与当前 API 相同功能的类比 API。然而,考虑到大量的库/API,手动查找类比 API 可能非常耗时且容易出错 ...

0 0 0 0 2024/09/03 arXiv:2308.11422v1 mmShen

大型开放领域知识图(KG)在现实世界问题中的应用带来了许多独特的挑战。在本文中,我们提出了对 Saga 平台的扩展,用于大规模持续构建和服务知识。特别是,我们描述了一个用于训练知识图嵌入的管道,该管道支持事实排名、事实验证、相关实体服务和实体链接支持等关键功能 ...

0 0 0 0 2024/07/01 arXiv:2305.09464v1 mmShen

在人工智能领域,基于大语言模型(LLM)的代理通过自然语言提示执行任务代表了一项重大进步,特别是消除了对常识等固定答案任务进行显式再训练或微调的需要问题和是/否查询。然而,将情境学习应用于开放式挑战(例如诗歌创作),由于所提供示例的全面性和代理理解问题中表达的内容的能力而暴露出很大的局限性,导致输出经​​常出现显着差异从预期结果来看。为了解决这一差距,我们的研究引入了 LLM 多智能体的内存共享(MS)框架,该框架利用实时内存存储和检索系统来增强上下文学习过程 ...

0 0 0 0 2024/06/24 arXiv:2404.09982v1 mmShen

大型语言模型 (LLM) 是巨大的人工神经网络,主要用于生成文本,但也提供非常复杂的语言使用概率模型。由于生成语义一致的文本需要一种有效的记忆形式,因此我们研究了 LLM 的记忆特性,并发现与人类记忆的关键特征惊人的相似之处。我们认为,大语言模型的类人记忆特性并不是从 LLM 架构中自动遵循的,而是从训练文本数据的统计中学习的 ...

0 0 0 0 2024/06/17 arXiv:2311.03839v3 mmShen

域外(OOD)意图发现和广义意图发现(GID)的任务旨在将封闭意图分类器扩展到开放世界意图集,这对于面向任务的对话(TOD)系统至关重要。以前的方法通过微调判别模型来解决这些问题。最近,虽然一些研究一直在探索以 ChatGPT 为代表的大语言模型(LLM)在各种下游任务中的应用,但 ChatGPT 发现并逐步扩展 OOD 意图的能力仍不清楚 ...

0 0 0 0 2024/04/19 arXiv:2310.10176v1 mmShen

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)