代理人的自我完善,代理的主链大语言模型(LLM)是根据自己的政策自动采样的轨迹进行培训的,它已成为提高性能的一种有希望的方法。最近的进步,尤其是在网络环境中,面临着一个关键的局限性:它们的性能将在自主学习周期期间达到停滞点,从而阻碍进一步的进步。我们认为,这源于对Web环境的探索有限,以及对LLMS中预训练的Web知识的利用不足 ...
自动化生物学实验由于需要毫米级的精度,长而多步实验以及生活系统的动态性质而保持挑战性。当前的液体处理程序仅部分自动化工作流程,需要人为干预板的装载,尖端更换和校准。工业解决方案提供了更多的自动化,但昂贵,并且缺乏研究环境中所需的灵活性 ...
人的声音不仅传达了言语,还传达了情感状态和个性。情感语音转换(EVC)会改变情绪表达,同时保留语言内容和说话者的身份,从而改善了人机互动等应用。尽管深度学习为精心制作的情感数据集提供了EVC模型,但现有方法通常会面临情绪准确性和语音失真的问题 ...
LLMS中的幻觉对他们在现实世界应用中的安全部署引起了重大关注。最近的方法利用LLM的潜在空间进行幻觉检测,但是它们的嵌入以语言连贯性而不是事实准确性进行了优化,通常无法清楚地分离出真实和幻觉的内容。为此,我们提出了真实性分离器向量(TSV),这是一种轻巧且灵活的转向向量,可以重塑推断期间LLM的表示空间,以增强不改变模型参数的真实和幻觉输出之间的分离 ...
连接视觉和语言在生成智能中起着至关重要的作用。因此,大量的研究工作已致力于图像字幕,即 ...
最近的工作探索了生成推荐系统作为传统基于ID的模型的替代方法,将项目推荐作为一个序列生成任务而不是离散的项目 Token 。尽管有希望,但与SASREC这样的基于ID的基准相比,这种方法在实践中通常表现不佳。在本文中,我们确定了阻止生成方法的两个关键局限性:项目 Token 化中缺乏协作信号,以及常用的编码器decoder架构中的效率低下 ...
人工智能 (AI) 天气预报 (AIWP) 模型是中期预报的强大工具,但往往缺乏物理一致性,导致输出违反守恒定律。本研究介绍了一组新颖的基于物理的方案,旨在加强 AIWP 模型中全球干燥空气质量、水分收支和大气总能量的守恒。这些方案是高度模块化的,可以无缝集成到各种人工智能模型架构中 ...
大型语言模型(LLM)的出现促进了人工智能的变革转变,为能够在不同领域跨越复杂的推理,强大的感知和多才多艺的动作铺平了道路。随着这些代理人越来越多地推动了人工智能研究和实际应用,它们的设计,评估和持续改进会带来复杂的多方面挑战。这项调查提供了全面的概述,在模块化的,脑为灵感的体系结构中构建了智能代理,该体系结构整合了认知科学,神经科学和计算研究的原理 ...