大型语言模型 (LLM) 通过实现类似人类的文本生成和自然语言理解,彻底改变了人工智能 (AI)。然而,它们对静态训练数据的依赖限制了它们响应动态、实时查询的能力,导致输出过时或不准确。检索增强生成(RAG)已经作为一种解决方案出现,通过集成实时数据检索来提供上下文相关的最新响应来增强 LLM  ...
0 0 0 2025/03/02 arXiv:2501.09136v3 Frazy
现有的基于LLM的代理商在持有任务上取得了出色的性能,但是他们看不见的任务的普遍性仍然很差。因此,最近的一些工作着重于对政策模型进行微调,以更加多样化的任务来提高普遍性。在这项工作中,我们发现为指导政策模型的奖励模型比直接对策略模型进行挑战更强大 ...
0 0 0 2025/03/02 arXiv:2502.18407v1 swtuser
现有的LLM代理系统通常从每个步骤中从固定且预定义的集合中选择动作。尽管这种方法在封闭的,狭窄的环境中有效,但我们认为,在现实世界中部署LLM代理时,它提出了两个主要挑战:(1)从一组固定的动作中选择明显限制了LLM代理的计划和行动能力,并且(2)这种方法需要实质性的行动,以阐明所有可能的行动,并在所有可能的行动中实施了所有可能的行动,并且可以在所有可能的行动中实施,以确保所有可能的行动。在这项工 ...
0 0 0 2025/03/01 arXiv:2411.01747v1 jueli
人类的理解和产生对于建模数字人类和人形体实施方案至关重要。最近,受通才模型(例如大语言和视觉模型)成功启发的以人为中心的基础模型(HCFM)已出现,将各种以人为中心的任务统一为单个框架,超过了传统的特定任务方法。在这项调查中,我们提出了将当前方法分类为四组的分类法,介绍了HCFMS的全面概述:(1)以人为中心的感知基础模型,该模型捕获了用于多模式2D和3D理解的精细元素特征 ...
0 0 0 2025/03/01 arXiv:2502.08556v1 alanyhan
基于大型语言模型的代理通过利用其丰富的背景知识和推理能力来加速科学发现方面的潜力。在本文中,我们介绍了生物生物熟悉的代理,该代理设计了新的实验,有关其结果的原因,并有效地导航了假设空间以达到所需的解决方案。我们在设计遗传扰动实验的问题上证明了我们的药物,其目的是从许多可能的基因中找到一个小子集,这些基因在扰动时会导致特定的表型(e ...
0 0 0 2025/02/28 arXiv:2405.17631v2 BinaryLL
本文介绍了DataScibench,这是评估数据科学中大型语言模型(LLM)功能的综合基准。最近的相关基准主要集中于单个任务,易于获得的地面真相以及直接的评估指标,这限制了可以评估的任务范围。相比之下,DataScibench是基于更全面和精心策划的自然和具有挑战性的提示,以确保不确定的地面真相和评估指标 ...
0 0 0 2025/02/28 arXiv:2502.13897v1 大红豆
在开放域中对话中,智能代理人应该展示知识的使用,但是迄今为止,很少有令人信服的证明。序列模型的最流行序列通常是“生成和希望”的通用话语,这些话语可以在模型的权重绘制到输入话语到输出时可以记住,而不是使用召回的知识作为上下文。到目前为止,知识的使用已被证明是困难的,部分原因是缺乏有监督的学习基准任务,该任务表现出知识渊博的公开对话,并具有清晰的基础 ...
0 0 0 2025/02/28 arXiv:1811.01241v2 xdykj

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)