arxiv VLAgents: A Policy Server for Efficient VLA Inference

/documents/70175/

基本信息

文件基本信息

名称
VLAgents: A Policy Server for Efficient VLA Inference
描述
视觉-语言-动作模型(VLA)的迅速出现对机器人技术产生了重大影响。然而,由于分散的接口和分布式设置中固有的通信延迟,它们的部署仍然很复杂。为了解决这个问题,我们引入了 VLAgents,这是一种模块化策略服务器,它在统一的 Gymnasium 风格协议背后抽象出 VLA 推理。至关重要的是,其通信层通过支持用于高速仿真的零拷贝共享内存和用于远程硬件的压缩流来透明地适应上下文。在这项工作中,我们展示了 VLAgents 的架构,并通过集成七个策略(包括 OpenVLA 和 Pi Zero)来验证它。在本地和远程通信的基准测试中,我们进一步展示了它如何优于 OpenVLA、OpenPi 和 LeRobot 提供的默认策略服务器。 VLAgents 可通过此 https URL 获取 ...