偏好优化,特别是通过人类反馈强化学习 (RLHF),在调整大型语言模型 (LLM) 以遵循人类意图方面取得了重大成功。与与固定数据集的离线对齐不同,人类或人工智能对模型生成的在线反馈收集通常会通过迭代过程产生更强大的奖励模型和更好对齐的 LLM 。然而,实现全球准确的奖励模型需要系统探索,以生成跨越自然语言广阔空间的多样化响应 ...
跟踪和跟随感兴趣的对象对于多种机器人用例至关重要,从工业自动化到物流和仓储,再到医疗保健和安全。在本文中,我们提出了一种实时检测、跟踪和跟随任何物体的机器人系统。我们的方法被称为“跟随任何东西”(FAn),是一种开放词汇和多模态模型——它不限于训练时看到的概念,并且可以在推理时使用文本、图像或单击查询 ...
分段任何模型(SAM)代表了自然图像分割领域最先进的研究进展,通过点和边界框等输入提示取得了令人印象深刻的结果。然而,我们的评估和最近的研究表明,直接将预训练,直接将预训练的山姆应用于医学图像分割并不能产生令人满意的性能。这种限制主要源于自然图像和医学图像之间的显着域差距... ...
大型模型(也称为基础模型)的出现给人工智能研究带来了重大进步。其中一种模型是 Segment Anything (SAM),它是为图像分割任务而设计的。然而,与其他基础模型一样,我们的实验结果表明,SAM 在某些分割任务中可能会失败或表现不佳,例如阴影检测和伪装对象检测(隐藏对象检测) ...
YOLOv7 在 5 FPS 到 160 FPS 范围内的速度和精度都超过了所有已知的目标检测器,并且在 GPU V100 上 30 FPS 或更高的所有已知实时目标检测器中具有最高的精度 56.8% AP YOLOv7-E6物体检测器(56 FPS V100、55. ... ...
多年来,YOLO系列一直是高效的目标检测事实上的行业级。YOLO社区蓬勃发展,丰富了其在硬件硬件平台和丰富场景中的应用。在一份技术报告中,我们力求将其极限推向新的高度,以坚定不移的行业应用心态向前迈进... ...
人们通过视觉、听觉、触觉以及过去的经验来“理解”世界。人类经验可以通过正常学习(我们称之为显性知识)或潜意识(我们称之为隐性知识)来学习。这些通过正常学习或潜意识学到的经验会被编码并存储在大脑中 ...
在本报告中,我们介绍了对YOLO系列的一些经验丰富的改进,形成了一种新型的高性能检测器——YOLOX。我们将YOLO检测器切换为无接口方式,并进行其他先进的检测技术,即... ...
我们证明,基于 CSP 方法的 YOLOv4 目标检测神经网络可以向上和向下扩展,并且适用于小型和大型网络,同时保持最佳速度和准确性。我们提出了一种网络缩放方法,不仅可以修改网络的深度、宽度、分辨率,还可以修改网络的结构。 YOLOv4-large 模型取得了最先进的结果:55 ...
DETR最近被提出来消除目标检测中对许多手工设计组件的需求,同时展示了良好的性能。然而,由于Transformer注意力模块在处理图像特征图方面的限制,其存在收敛速度慢和特征空间分辨率有限为了解决这些问题,我们提出了Deformable DETR,其注意力模块仅参考关注周围的一组关键采样点... ...