机器人技术中的持续学习寻求可以不断适应不断变化的环境和任务的系统,从而反映人类的适应性。一个关键的挑战是精炼动态模型,对于计划和控制至关重要,同时解决了安全适应,灾难性遗忘,离群机管理,数据效率以及平衡探索与剥削的平衡 - 所有这些问题 - 都在任务和车载资源约束中。为了实现这一目标,我们引入了一个生成框架,利用流动匹配的在线机器人动力学模型对齐 ...
在药物发现中,用于蛋白质配体结合的分子动力学(MD)模拟为预测结合亲和力,估计运输特性和探索口袋位点提供了强大的工具。通过更好的数值方法,通过使用机器学习(ML)方法来提高MD仿真效率的悠久历史。然而,仍然存在挑战,例如对延长时尺度模拟的准确建模 ...
大型语言模型(LLM)的最新进展显着增强了对话系统的功能,使其适用于各个领域(例如,教育) ...
大型语言模型(LLMS),例如GPT3.5,在理解和生成自然语言方面表现出非常熟练的水平。另一方面,医疗助理有可能为个人提供可观的好处 ...
推荐系统(RSS)提供了基于用户兴趣的个性化建议服务,这些建议在各种平台中广泛使用。但是,由于缺乏消费行为,有很多用户兴趣很少,这会导致他们的建议结果不佳。这个问题在大规模的RSS中广泛存在,并且尤其难以解决 ...
可靠且可扩展的分子力学(MM)力场的发展 - 表征分子系统势能表面的快速,经验模型 - 对于生物分子模拟和计算机辅助药物设计是必不可少的。在这里,我们介绍了一个通用且可扩展的机器学习的MM力场,\ texttt {Espaloma-0.3},并使用图形神经网络来克服传统基于规则的方法的限制 ...
最近的大语言模型(LLM)驱动的聊天助手系统集成了内存组件来跟踪用户助手的聊天历史,从而实现更准确和个性化的响应。然而,它们在持续相互作用中的长期记忆能力仍未得到充分探索。本文介绍了 LongMemEval,这是一个综合基准测试,旨在评估聊天助理的五种核心长期记忆能力:信息提取、多会话推理、时间推理、知识更新和放弃 ...
稀疏奖励的探索仍然是强化学习(RL)的挑战性研究问题。特别是对于顺序对象操纵任务,RL代理总是会获得负奖励,直到完成所有子任务,从而导致勘探效率较低。为了有效地解决这些任务,我们提出了一种新颖的自导持续RL框架Relayher(RHER) ...