在本文中,我们提出了信仰行为树(BBT),这是行为树(BTS)的扩展,该行为树(BTS)允许自动创建一个在可观察到的环境中控制机器人的策略。我们扩展了BT的语义,以说明影响BT条件和动作节点的不确定性。根据最近提出的BTS计划策略,该树是合成的:从一组目标条件下,我们迭代选择一个目标,并找到满足该目标的动作或一般的子树 ...
在法律决定中,当法官无法达成一致的决定时,就会发生分裂投票(SV),这对必须导航各种法律论点和意见的律师构成困难。在高风险领域中,了解人类和人工智能系统之间感知难度的一致性对于建立信任至关重要。但是,现有的NLP校准方法集中于分类器对预测性能的认识,该方法针对人类多数级别衡量,俯瞰固有的人类标签变化(HLV) ...
多步多模式推理任务对多模式大语言模型(MLLM)构成了重大挑战,并在这种情况下寻找有效的方法来增强其性能仍然是一个尚未解决的问题。在本文中,我们提出了AR-MCT,这是一种通用框架,旨在通过主动检索(AR)和Monte Carlo Tree搜索(MCT)逐步提高MLLM的推理能力。我们的方法始于开发一个统一的检索模块,该模块检索了关键的支持见解,以从混合模式检索语料库中解决复杂的推理问题 ...
最近,有许多共同的任务是针对大型语言模型(LLM)生成的文本的检测的。但是,这些共享任务倾向于将重点放在文本仅限于一个特定领域的情况下,或者可以从许多域中进行文本的情况,而文本可以在测试时间内看不到。在此共享的任务中,使用新发布的RAID基准测试,我们旨在回答模型是否可以从大型但固定的域和LLM中检测出生成的文本,所有这些文本在培训期间都可以看到 ...
在与门这样的日常物体互动时,在非结构化环境中运行的机器人面临重大挑战。他们特别努力地跨越各种门类型和条件。现有的基于视觉的开环规划方法通常缺乏处理不同门设计,机构和推送/拉配置的鲁棒性 ...
推荐系统已被广泛应用于不同的现实生活中,以帮助我们找到有用的信息。特别是,由于互动性质和自主学习能力,近年来,基于加强学习(RL)的推荐系统已成为一个新兴的研究主题。经验结果表明,基于RL的建议方法通常超过大多数监督学习方法 ...
我们描述了法医适配器,这是一个适配器网络,旨在将夹子转换为有效且可推广的伪造探测器。尽管夹子的用途高度高,但是将其调整为面部伪造的检测是非平凡的,因为与伪造的知识与广泛的无关知识纠缠在一起。现有方法仅将剪辑视为提取器,缺乏特定于任务的适应性,从而限制了其有效性 ...
随着基于视觉 Transformer 的模型的规模,这些新任务的这些大规模经过预定的模型的填充已经变得越来越强。视觉及时调整作为参数有效的芬特(PEFT)方法引入了此趋势。尽管取得了成功,但在几乎所有PEFT方法中都存在着一个显着的研究挑战:当在预训练和填充阶段应用的数据集之间存在很大的差异时,就会观察到显着的性能下降 ...