轨迹预测是从过去数据中预测未来代理行为的任务,对于安全有效的自动驾驶至关重要。多种方法(例如 ...
学习一个机器人助手的感知和推理模块,以计划基于自然语言指令执行复杂任务的步骤通常需要大量的自由语言注释,尤其是对于短期的高级指令。为了降低注释的成本,大语言模型(LLMS)用作少量数据的计划者。但是,在详细说明步骤时,即使是使用LLM的最先进的计划者也主要依赖语言常识,通常会忽略指挥接收中环境的状态,从而导致不适当的计划 ...
垃圾定量是改善城市清洁度的重要步骤。当人类的解释太麻烦或在某些情况下是不可能的,清洁的客观指数可能会因意识行动而减少乱扔垃圾。在本文中,我们根据街道和人行道拍摄的图像提出了一个全自动的计算机视觉应用程序,以进行垃圾定量 ...
大型语言模型(LLM)越来越多地在各个域上应用,包括与代码相关的任务,例如代码翻译。先前的研究已经使用LLMS探索了在不同编程语言之间翻译代码的探索。由于LLM在自然语言方面更有效,因此使用自然语言作为代码翻译任务中的中间表示,提出了一种有希望的方法 ...
最近的实时语义细分模型,无论是单分支还是多分支,都可以实现良好的性能和速度。但是,它们的速度受到多路径块的限制,有些依赖于高性能的教师模型进行培训。为了克服这些问题,我们提出了黄金Cudgel网络(GCNET) ...
改变衣服的人的重新识别(CC-REID)旨在在不同的衣服场景下认识个人。当前的CC固定方法要么专注于使用其他模态(包括轮廓,姿势和身体网格)进行建模的身体形状,因此可能导致模型忽略其他关键生物特征特征,例如性别,年龄和样式,或者它们通过其他标签通过模型试图忽略或强调的其他标签进行监督,例如服装或个人属性或个人属性或个人属性。但是,这些注释本质上是离散的,不会捕获全面的描述 ...
尽管近年来端到端的自主驾驶(E2E-AD)技术取得了重大进展,但闭环评估的性能仍然不令人满意。在查询设计和互动中利用计划的潜力尚未得到充分探索。在本文中,我们介绍了一个多粒性计划查询表示形式,该图表整合了异构航路点,包括各种采样模式的空间,时间和驾驶式航路点 ...
早期退出是提高深网推理效率的有效范式。通过构造具有不同资源需求的分类器(退出),此类网络可以在早期出口处输出简单的样本,从而消除了执行更深层的需求。尽管现有作品主要关注多EXIT网络的建筑设计,但此类模型的培训策略在很大程度上没有探索 ...