通过图形用户界面(GUI)自主操作移动应用程序的应用程序代理对现实世界应用产生了浓厚的兴趣。但是,他们经常在长途计划中挣扎,未能找到更长的步骤的复杂任务的最佳行动。为了解决这个问题,世界模型用于根据用户行动来预测下一个GUI观察,从而实现了更有效的代理计划 ...
轨迹预测已在许多领域广泛追求,并且已经探索了许多基于模型和模型的方法。前者包括基于规则的,几何或基于优化的模型,后者主要由深度学习方法组成。在本文中,我们提出了一种基于新的神经微分方程模型的新方法,结合了两种方法 ...
在本文中,我们旨在仅利用离线轨迹数据来培训多目标RL的策略。我们将离线策略注册方法扩展到单目标离线RL问题的广泛选择方法,以实现上述目标。但是,这种方法在离线MORL设置中面临着新的挑战,即偏爱示威问题 ...
科学机器学习的最新工作开发了所谓的物理信息神经网络(PINN)模型。典型的方法是将物理领域知识纳入经验损失功能的软限制,并使用现有的机器学习方法来训练模型。我们证明,尽管现有的Pinn方法可以为相对琐碎的问题学习好的模型,但它们很容易就无法学习相关的物理现象,甚至更复杂 ...
人类可以从顺序视觉观察(例如以自我为中心的视频流)来感知和理由。但是,预估计的模型如何获得此类能力,尤其是高级推理,尚不清楚。本文介绍了Bobsodied-R,这是一个合作的框架,结合了大规模视觉语言模型(VLMS),用于感知和小规模语言模型(LMS)进行推理 ...
物理知识的神经网络(PINN)方法是一种使用深度学习来求解部分微分方程的新方法。 $ l^2 $物理信息损失是培训物理信息神经网络的事实上的标准。在本文中,我们通过研究损失函数与学习解决方案的近似质量之间的关系来挑战这种常见实践 ...
通过进化算法解决受限的多目标优化问题已引起了相当大的关注。通过使用不同的算法策略,进化运算符和约束处理技术,已经开发了各种受约束的多目标优化进化算法(CMOEAS)。 CMOEA的性能可能很大程度上取决于所使用的操作员,但是,通常很难为当前的问题选择合适的操作员 ...
我们考虑了一个很大的实际兴趣问题:从其条目的采样中恢复数据矩阵。假设我们观察到从矩阵M随机选择的M条目。我们可以完成矩阵并恢复我们尚未看到的条目吗?我们表明,一个人可以从看起来不完整的条目中完美地恢复大多数低级矩阵 ...