产生聪明且可推广的面部表情的能力对于建立类似人类的社会机器人至关重要。目前,这一领域的进展受到了以下事实的阻碍:每个面部表情都需要由人类编程。为了实时调整机器人行为,与人类受试者互动时出现的不同情况,机器人需要能够训练自己而不需要人类标签,并做出快速的行动决策,并将获得的知识推广到各种和新的环境中 ...
获得潜在语义的能力是决定语言模型性能的关键属性之一。调用此能力的一种方便方法是预定元数据(例如 ...
我们引入了一种新颖的 3D 生成方法,用于创建多功能且高质量的 3D 资产。其基础是统一的结构化 LATent (SLAT) 表示,它允许解码为不同的输出格式,例如辐射场、3D 高斯和网格。这是通过将稀疏的 3D 网格与从强大的视觉基础模型中提取的密集多视图视觉特征相集成来实现的,全面捕获结构(几何)和纹理(外观)信息,同时保持解码过程中的灵活性 ...
大型语言模型(LLM)由于广泛的世界知识和强大的推理能力,在推荐系统(RS)中引起了极大的关注。但是,一个关键的挑战在于使LLM有效地理解和从大规模的用户行为中提取见解。当前的方法可以直接利用LLM来用于用户兴趣学习在处理长期顺序行为,有效提高兴趣并在实际情况下运用兴趣时,面临限制 ...
持续的内存增强允许计算机使用代理(CUA)从过去的交互中学习,并随着时间的推移来完善其任务解决策略。但是,未经检查的内存积累可以引入降低代理性能的虚假或幻觉的“学习”,尤其是在特定领域的工作流程(例如生产力软件)中。我们提出了一个新颖的框架,有效,该框架通过(1)(1)培训期间的专家策划的域知识的种子有效地管理CUAS的记忆,(2)训练期间的迭代性,基于轨迹的记忆细化,以及(3)人类专家的事后事实 ...
跨域CTR(CDCTR)预测是一个重要的研究主题,它研究了如何利用来自相关领域的有意义的数据来帮助目标域中的CTR预测。大多数现有的CDCTR的作品设计与跨域转移知识(例如参数共享)的隐性方法,该域将目标域中的模型培训正规化。更有效的是,最近的研究人员提出了明确的技术来提取用户兴趣知识并将这些知识转移到目标领域 ...
大型语言模型(LLM)的不断进步使人们越来越关注开发公平可靠的方法来评估其性能的关键问题。特别是测试集泄漏、提示格式过拟合等主观或非主观作弊现象的出现,给 LLM 的可靠评估带来了重大挑战。由于评估框架通常利用正则表达式 (RegEx) 进行答案提取,因此某些模型可能会调整其响应以符合 RegEx 可以轻松提取的特定格式 ...
LLM驱动的AI角色的兴起引起了安全问题,特别是对于患有心理疾病的脆弱人类用户。为了解决这些风险,我们提出了EmoAgent,这是一个多代理AI框架,旨在评估和减轻人类互动中的心理健康危害。 EmoAgent包括两个组成部分:Emoeval模拟虚拟用户,包括那些描绘精神脆弱的人,以评估与AI角色互动之前和之后的心理健康变化 ...