对话中的情感认识是一项具有挑战性的任务,由于其潜在应用,最近越来越受欢迎。但是,到目前为止,缺少一个大型的多模式的多方情感对话数据库,其中包含每个对话的两个以上的扬声器。因此,我们提出了多模式情感线数据集(MELD),即情绪线的扩展和增强 ...
多传感器融合对于自动驾驶汽车定位至关重要,因为它能够整合来自各种来源的数据以提高准确性和可靠性。集成位置和方向的准确性取决于不确定性建模的精度。不确定性建模的传统方法通常假设高斯分布,并涉及手动启发式参数调整 ...
定性空间推理是知识代表和推理的一个良好探索的领域,并且具有从地理信息系统到机器人技术和计算机视觉的多个应用程序。最近,已经对大语言模型(LLM)的推理能力提出了许多主张。在这里,我们研究了一组代表性的LLM可以在Mereotogology区域连接计算中执行经典的定性空间推理任务,RCC-8 ...
这项研究利用游戏代号作为基准测试工具来评估有关特定语言和认知技能的大型语言模型(LLM)。 LLM在游戏的每一侧都玩,其中一侧生成一个线索词,涵盖了几个目标单词,而另一侧猜测这些目标单词。我们通过控制单词的选择来设计各种实验(抽象与 ...
本文提出了一种双分裂和优化算法(DUALOPT),用于解决大型旅行推销员问题(TSP)。 Dualopt结合了两种互补策略,以提高解决方案质量和计算效率。第一个策略是基于网格的分隔和拼接程序,将TSP划分为较小的子问题,并通过合并节点和部分路线并平行地求解解决方案 ...
基于对车辆路由问题的分裂方法(VRP)的神经求解器,尤其是电容的VRP(CVRP),将实例的全球分区与每个子问题的局部结构集成在一起,以增强概括。但是,在全球分区阶段,子图中的杂物倾向于在基于学习的分区策略的多步解码过程中逐渐复合。尽管使用了最佳的局部结构,但在全球分区阶段的这种次优行为又可能导致总体分解系统的性能急剧恶化 ...
在这项研究中,我们通过描述定义和解决零拍摄的“真实”分类,这是一个新的任务,该任务评估了视觉模型(VLMS)(例如剪辑)之类的能力,例如剪辑,仅根据描述性属性对对象进行分类,不包括对象类名称。这种方法突出了VLM在理解复杂的对象描述中的当前局限性,将这些模型推向了仅仅是对象识别。为了促进这种探索,我们引入了一个新的挑战,并发布了六个流行的细粒基准的数据,该数据省略了对象名称,以鼓励研究社区内的真正 ...
在这项工作中,我们提出了一种结合对象检测模型的预测的新方法:加权框融合。我们的算法利用所有提出的边界框的置信度得分来构建平均框。我们在几个数据集上测试了方法,并在开放图像和可可对象检测轨道的上下文中对其进行了评估,从而在这些挑战中实现了最高的结果 ...