我们提出了genmm,这是一种生成模型,可以从单个或几个示例序列中“挖掘”,现有的数据驱动方法通常需要较长的离线训练时间,容易出现视觉伪影 ...
神经网络是其输入和参数的复杂函数。深度学习理论的许多先前工作分析了固定一组输入的网络输出的分布(例如 ...
(llm)的新型零样本文档排序方法:setwise提示方法。我们的方法补充了基于llm:pointsise poipwise p pairwise listwise,并考虑模型大小、,并考虑模型大小、 Token 消耗、延迟等因素,我们表明现有方法本质上是在有效性和效率之间进行权衡... ...
完成家庭任务需要考虑以前行动的后果来逐步计划。但是,最先进的体现的代理通常会在环境导航并与适当的对象进行互动时犯错,因为在没有这种知识的情况下模仿专家或算法计划者而导致的学习不完善。为了改善视觉导航和对象互动,我们建议考虑结合语义上下文的Capeam(上下文感知计划和环境感知记忆)采取行动的结果(e ...
轨迹预测是从过去数据中预测未来代理行为的任务,对于安全有效的自动驾驶至关重要。多种方法(例如 ...
学习一个机器人助手的感知和推理模块,以计划基于自然语言指令执行复杂任务的步骤通常需要大量的自由语言注释,尤其是对于短期的高级指令。为了降低注释的成本,大语言模型(LLMS)用作少量数据的计划者。但是,在详细说明步骤时,即使是使用LLM的最先进的计划者也主要依赖语言常识,通常会忽略指挥接收中环境的状态,从而导致不适当的计划 ...
垃圾定量是改善城市清洁度的重要步骤。当人类的解释太麻烦或在某些情况下是不可能的,清洁的客观指数可能会因意识行动而减少乱扔垃圾。在本文中,我们根据街道和人行道拍摄的图像提出了一个全自动的计算机视觉应用程序,以进行垃圾定量 ...
大型语言模型(LLM)越来越多地在各个域上应用,包括与代码相关的任务,例如代码翻译。先前的研究已经使用LLMS探索了在不同编程语言之间翻译代码的探索。由于LLM在自然语言方面更有效,因此使用自然语言作为代码翻译任务中的中间表示,提出了一种有希望的方法 ...