时空预测在各个部门(例如运输系统,物流和供应链管理)中起着至关重要的作用。但是,现有方法受其处理大型,复杂数据集的能力的限制。为了克服这一限制,我们引入了一种混合方法,该方法结合了开源大型和小型语言模型(LLMS和LMS)的优势与传统的预测方法 ...
在跨域和语言上扩展核心分辨率的最新工作依赖于目标域和语言中的注释数据。同时,据报道,预先训练的大型语言模型(LMS)在广泛的NLP任务中具有强大的零和很少的学习能力。但是,先前的工作主要使用人工句子级数据集(例如Winograd schema Challenge)研究了这种能力 ...
预训练的语言模型(PLM),例如CHATGPT,已经显着推进了自然语言处理领域。这一进展激发了一系列创新的研究,该研究探讨了PLM对时间序列分析的适应性,该研究打算创建一个统一的基础模型,以解决各种时间序列分析任务。但是,这些努力主要集中在定期采样的时间序列(RST)上,忽略了不规则采样时间序列(IST)所带来的独特挑战,这些挑战的特征是采样间隔不平均,并且缺少数据 ...
视频大语言模型(视频LLM)在视频理解中表现出了有希望的能力,但是他们在跟踪时间变化和有关时间关系的推理方面很难。虽然先前的研究将这种局限性归因于视觉输入的无效时间编码,但我们的诊断研究表明,视频表示包含足够的信息,即使是小型探测分类器也可以达到完美的准确性。出人意料的是,我们发现Video LLMS的时间推理能力中的关键瓶颈源于LLM在时间概念上的固有难度,这证明了文本暂时提问任务的绩效不佳 . ...
近年来,将传统的RGB摄像机与生物风格的事件相机结合起来,吸引了越来越多的物体跟踪。但是,大多数现有的多模式跟踪算法在很大程度上取决于高复杂性视觉 Transformer 体系结构,用于跨模态的特征提取和融合。这不仅导致了大量的计算开销,而且还限制了跨模式相互作用的有效性 ...
合作感知通过提供对环境的全面看法,增强了自动驾驶汽车(AV)的个人看法能力。但是,平衡感知性能和传播成本仍然是一个重大挑战。当前在跨代理传输区域级特征的方法限制了可解释性和需求大量的带宽,这使得它们不适合实际应用 ...
模仿学习已成为机器人操纵中的一种基本方法。但是,收集大型现实世界机器人的演示非常昂贵。模拟器提供了一种具有成本效益的替代方案,但是SIM到实现的差距使其规模极具挑战性 ...
由于更强的自定义功能,图像定制的最新进展展示了广泛的应用程序前景。但是,由于我们人类对面孔更敏感,因此在保持一致的身份的同时避免身份混乱的多种参考图像,限制了自定义模型的身份可扩展性。为了解决这个问题,我们提出了一个统一的多个认同优化框架Umo,旨在保持高保真身份保存并减轻与可伸缩性的认同混淆 ...