定性空间推理是知识代表和推理的一个良好探索的领域,并且具有从地理信息系统到机器人技术和计算机视觉的多个应用程序。最近,已经对大语言模型(LLM)的推理能力提出了许多主张。在这里,我们研究了一组代表性的LLM可以在Mereotogology区域连接计算中执行经典的定性空间推理任务,RCC-8 ...
0 0 0 2025/03/12 arXiv:2411.19589v1 newclaude12
这项研究利用游戏代号作为基准测试工具来评估有关特定语言和认知技能的大型语言模型(LLM)。 LLM在游戏的每一侧都玩,其中一侧生成一个线索词,涵盖了几个目标单词,而另一侧猜测这些目标单词。我们通过控制单词的选择来设计各种实验(抽象与 ...
0 0 0 2025/03/12 arXiv:2502.11707v1 newclaude12
本文提出了一种双分裂和优化算法(DUALOPT),用于解决大型旅行推销员问题(TSP)。 Dualopt结合了两种互补策略,以提高解决方案质量和计算效率。第一个策略是基于网格的分隔和拼接程序,将TSP划分为较小的子问题,并通过合并节点和部分路线并平行地求解解决方案 ...
0 0 0 2025/03/12 arXiv:2501.08565v1 alex666
基于对车辆路由问题的分裂方法(VRP)的神经求解器,尤其是电容的VRP(CVRP),将实例的全球分区与每个子问题的局部结构集成在一起,以增强概括。但是,在全球分区阶段,子图中的杂物倾向于在基于学习的分区策略的多步解码过程中逐渐复合。尽管使用了最佳的局部结构,但在全球分区阶段的这种次优行为又可能导致总体分解系统的性能急剧恶化 ...
0 0 0 2025/03/12 arXiv:2502.08340v1 alex666
在这项研究中,我们通过描述定义和解决零拍摄的“真实”分类,这是一个新的任务,该任务评估了视觉模型(VLMS)(例如剪辑)之类的能力,例如剪辑,仅根据描述性属性对对象进行分类,不包括对象类名称。这种方法突出了VLM在理解复杂的对象描述中的当前局限性,将这些模型推向了仅仅是对象识别。为了促进这种探索,我们引入了一个新的挑战,并发布了六个流行的细粒基准的数据,该数据省略了对象名称,以鼓励研究社区内的真正 ...
0 0 0 2025/03/12 arXiv:2412.13947v1 arthur
在这项工作中,我们提出了一种结合对象检测模型的预测的新方法:加权框融合。我们的算法利用所有提出的边界框的置信度得分来构建平均框。我们在几个数据集上测试了方法,并在开放图像和可可对象检测轨道的上下文中对其进行了评估,从而在这些挑战中实现了最高的结果 ...
0 0 0 2025/03/11 arXiv:1910.13302v3 hulin01
基于断言的验证(ABV)是确保设计电路符合其架构规范的关键方法,该规范通常在自然语言中进行描述。这个过程通常需要通过验证工程师将这些规格转换为功能验证断言的人类解释。从自然语言规范中生成断言的现有方法仅限于工程师提取的句子,而劝阻其实际应用 ...
0 0 0 2025/03/11 arXiv:2402.00386v3 tboy
端到端建设性神经组合优化的当前方法通常使用从专家解决方案或策略梯度方法克隆的行为来训练政策。虽然行为克隆很简单,但它需要昂贵的专家解决方案,而政策梯度方法通常在计算上要求且复杂。在这项工作中,我们通过在每个时期中使用当前模型对多个实例进行多个解决方案进行采样,然后选择最佳解决方案作为监督模仿学习的专家轨迹,从而简化了训练过程 ...
0 0 0 2025/03/11 arXiv:2403.15180v2 alex666

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)