广义引用表达式分割(gres)扩展了经典res的范围,可以引用一个表达式中的多个对象或识别图像中不存在的空目标。gres 在对图像中实例的复杂空间关系进行建模以及识别不存在的参照物方面提出了挑战。多模态大语言模型( mllm)最近在这些复杂的视觉语言任务中显示出巨大的进步... ...
最近,在本地部署DeepSeek-R1和V3的需求很高,这可能是因为官方服务通常会忙于忙碌,并且有些组织有数据隐私问题。虽然单机器部署提供基础架构简单性,但模型的671B FP8参数配置超过了标准8-GPU机器的实际存储限制。量化是一种广泛使用的技术,有助于减少模型记忆消耗 ...
归纳逻辑推理是图形分析中的一项基本任务,该任务旨在从数据中概括模式。使用电感逻辑编程(ILP)等技术,已经针对传统图表(例如知识图(kg))对此任务进行了广泛的研究。现有的ILP方法假设从具有静态事实和二进制关系的KG学习 ...
实时安全指标对于自动驾驶系统(AD)评估驾驶情况并协助决策的风险很重要。尽管文献中已经提出了许多实时安全指标,但缺乏对这些安全指标的系统性能评估。由于不同的安全指标采用了不同的行为假设,因此很难比较安全指标并评估其性能 ...
多模态大型语言模型((M)LLM)的出现开辟了人工智能的新途径,limsim ++,limsim的扩展版本,专为(m)llm llm在自动驾驶中的应用而设计。limsim++认识到现有仿真平台的局限性,解决了对支持自动驾驶持续学习和改进泛化的长期闭环基础设施的需求... ...
我们推出infinigen室内,这是一款基于搅拌器的逼真室内场景程序生成器。它建立在现有的infinigen系统之上,该系统专注于自然场景,但通过引入多样化的程序室内资产库(包括家具、建筑元素、电器和其他日常物品) ...
我们介绍infinigen,一个自然世界逼真3d场景的程序生成器。infinigen:从形状到纹理:从形状到纹理,每项资源都是通过随机数学规则从头开始生成的,不使用外部源并允许无限的变化和组合。infinigen广泛覆盖自然世界中的物体和场景 ...
知识蒸馏(KD)是借助训练有素的教师模型来训练轻量级学生模型的典型方法。但是,大多数KD方法都需要访问教师的培训数据或模型参数,这是不现实的。为了解决这个问题,最近的Works在无数据和黑色盒子设置下研究KD ...