知识图(KG)以三元组(头、关系、尾)的形式表示人工制作的事实知识,它们共同构成一个图。 KG问答(KGQA)是根据KG提供的信息回答自然问题的任务。模型 (LLM) 遗传卓越的自然语言理解能力而成为 QA 任务的最先进模型... ...
本文档将回顾使用多层卷积架构的最突出的提案。重要的是,将通过回顾不同方法来讨论典型卷积网络的各个组成部分,这些方法的设计决策基于生物学发现和/或合理的理论基础。此外,还将回顾通过可视化和实证研究来理解卷积网络的不同尝试 ...
基于人类反馈的强化学习 (RLHF) 在使大型语言模型 (LLM) 与人类偏好保持一致方面展现出了巨大的前景。根据偏好数据的可用性,线上和线下 RLHF 都是活跃的调查领域。一个关键瓶颈是理解如何将不确定性估计纳入从 RLHF 偏好数据学习的奖励函数中,无论偏好数据是如何收集的 ...
偏好优化,特别是通过人类反馈强化学习 (RLHF),在调整大型语言模型 (LLM) 以遵循人类意图方面取得了重大成功。与与固定数据集的离线对齐不同,人类或人工智能对模型生成的在线反馈收集通常会通过迭代过程产生更强大的奖励模型和更好对齐的 LLM 。然而,实现全球准确的奖励模型需要系统探索,以生成跨越自然语言广阔空间的多样化响应 ...
跟踪和跟随感兴趣的对象对于多种机器人用例至关重要,从工业自动化到物流和仓储,再到医疗保健和安全。在本文中,我们提出了一种实时检测、跟踪和跟随任何物体的机器人系统。我们的方法被称为“跟随任何东西”(FAn),是一种开放词汇和多模态模型——它不限于训练时看到的概念,并且可以在推理时使用文本、图像或单击查询 ...
分段任何模型(SAM)代表了自然图像分割领域最先进的研究进展,通过点和边界框等输入提示取得了令人印象深刻的结果。然而,我们的评估和最近的研究表明,直接将预训练,直接将预训练的山姆应用于医学图像分割并不能产生令人满意的性能。这种限制主要源于自然图像和医学图像之间的显着域差距... ...
大型模型(也称为基础模型)的出现给人工智能研究带来了重大进步。其中一种模型是 Segment Anything (SAM),它是为图像分割任务而设计的。然而,与其他基础模型一样,我们的实验结果表明,SAM 在某些分割任务中可能会失败或表现不佳,例如阴影检测和伪装对象检测(隐藏对象检测) ...
YOLOv7 在 5 FPS 到 160 FPS 范围内的速度和精度都超过了所有已知的目标检测器,并且在 GPU V100 上 30 FPS 或更高的所有已知实时目标检测器中具有最高的精度 56.8% AP YOLOv7-E6物体检测器(56 FPS V100、55. ... ...
多年来,YOLO系列一直是高效的目标检测事实上的行业级。YOLO社区蓬勃发展,丰富了其在硬件硬件平台和丰富场景中的应用。在一份技术报告中,我们力求将其极限推向新的高度,以坚定不移的行业应用心态向前迈进... ...
(“理解” 世界。人类经验可以通过正常学习(我们称之为显性知识)(或潜意识(我们称之为隐性知识)来学习。这些通过正常学习或潜意识学到的经验会被编码并存储在大脑中)来学习。这些通过正常学习或潜意识学到的经验会被编码并存储在大脑中... ...