我们提出了人机协作规划和推理任务(PARTNR)的基准,旨在研究家庭活动中的人机协调。 PARTNR 任务表现出日常任务的特征,例如空间、时间和异构代理能力约束。我们采用使用大型语言模型 (LLM) 的半自动任务生成管道,将模拟纳入循环中以进行基础和验证 ...
我们提出了人机协作规划和推理任务(PARTNR)的基准,旨在研究家庭活动中的人机协调。 PARTNR 任务表现出日常任务的特征,例如空间、时间和异构代理能力约束。我们采用使用大型语言模型 (LLM) 的半自动任务生成管道,将模拟纳入循环中以进行基础和验证 ...