大型语言模型尚未广泛适用于科学数据集的分析,部分原因是数字标记的独特困难。我们提出了 xVal,一种仅使用单个标记表示任何实数的数字编码方案。 xVal 通过按数值缩放专用嵌入向量来表示给定的实数 ...
自监督单目深度估计在静态场景中显示出令人印象深刻的结果。它依赖于训练网络的多视图一致性假设,然而,这在动态对象区域和遮挡中被违反了。因此,现有方法在动态场景中的准确性较差,并且估计的深度图在对象边界处模糊,因为它们通常在其他训练视图中被遮挡 ...
最近的研究引起了人们对网络设计中“星型运算”(元素乘法)尚未开发的潜力的关注。虽然直观的解释比比皆是,但其应用背后的基本原理在很大程度上仍未被探索。我们的研究试图揭示星型运算将输入映射到高维非线性特征空间的能力(类似于核技巧),而无需扩大网络 ...
直接从原始传感器生成规划结果是自动驾驶长期以来渴望的解决方案,并且最近引起了越来越多的关注。大多数现有的端到端自动驾驶方法都将这个问题分解为感知、运动预测和规划。然而,我们认为传统的渐进式管道仍然无法全面模拟整个交通演化过程,例如 ...
LiDAR 相机的 3D 物体检测在算法开发中遇到了过度拟合,这是由于违反了一些基本规则而导致的。我们参考数据集构建中的数据注释进行理论补充,并认为回归任务预测不应涉及来自相机分支的特征。通过遵循“检测作为标签”的前沿观点,我们提出了一种称为 DAL 的新颖范例 ...