高效且高准确的3D占用预测对于确保自主驾驶(AD)系统的性能至关重要。但是,许多当前的方法集中在高精度上,而牺牲了实时处理需求。为了解决平衡准确性和推理速度的挑战,我们提出了一种定向纯2D方法 ...
0 0 0 2025/08/23 arXiv:2507.23599v1 chenhualin
语义场景完成(SSC)旨在从单个图像中推断出场景的3D几何和语义。与在很大程度上依赖昂贵的地面注释的SSC上的先前工作相反,我们在无监督的环境中接近SSC。我们的新方法SceneDino从自我监督的表示学习和2D无监督的场景理解中适应了SSC的技术 ...
0 0 0 2025/08/23 arXiv:2507.06230v2 chenhualin
占用对于自动驾驶至关重要,为知觉和计划提供了必不可少的几何先验。但是,现有方法主要依赖于基于激光雷达的占用注释,这限制了可扩展性并防止利用大量潜在的众包数据进行自动标记。为了解决这个问题,我们提出了GS-OCC3D,这是一个直接重建占用率的可扩展视觉框架 ...
0 0 0 2025/08/23 arXiv:2507.19451v3 chenhualin
3D占用率成为自主驾驶以细粒度对周围环境建模的有前途的感知表示。但是,由于高处理成本以及体素的不确定性和动态,在多个输入帧中有效汇总3D占用率仍然充满挑战。为了解决这个问题,我们提出了ST-OCC,这是一个场景级的占用表示框架,可以有效地学习具有时间一致性的时空特征 ...
0 0 0 2025/08/23 arXiv:2508.04705v1 chenhualin
解决复杂的现实世界问题需要深入的信息寻求和多步推理。代理系统的最新进展以深入的研究为例,强调了自动多步研究的潜力。在这项工作中,我们提出了一个有凝聚力的范式,用于从以数据为中心和培训阶段的角度来构建端到端的代理信息 ...
0 0 0 2025/08/23 arXiv:2505.22648v3 uaene
语音转换(VC)是语音综合的关键研究领域,使演讲者的声音特征的转换能够在保留语言内容的同时类似于另一个。这项技术具有广泛的应用,包括自动化电影配音,演讲转换的转换以及用于病理语音康复的辅助设备。随着对高质量和自然综合声音的需求不断增长,研究人员开发了广泛的VC技术 ...
0 0 0 2025/08/23 arXiv:2504.19197v1 jack_j
多机构探路(MAPF)是多机器人轨迹计划问题的常见抽象,其中多个同质机器人同时在共享环境中移动。虽然已证明求解MAPF是NP-固定,可扩展且高效的,但对于物流,搜索和响应等现实世界应用程序,求解器至关重要。为此,分散的次级化次优的MAPF Solvers,利用机器学习的利用机器已经出现在舞台上 ...
0 0 0 2025/08/23 arXiv:2506.23793v1 kuioma
我们考虑在顺序推荐方案中从正面和负面反馈中学习的任务,因为用户交互中通常存在两种反馈。同时,常规的顺序学习模型通常着重于考虑和预测积极的互动,而忽略了在建议中减少负面反馈的项目可以提高用户对服务的满意度。此外,负面反馈可能会提供有用的信号,以更准确地识别真正的用户兴趣 ...
0 0 0 2025/08/23 arXiv:2508.14786v1 missbear

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)