小组模棱两可的卷积(GCONV)使模型探索数据中的基本对称性,从而提高性能。但是,现实世界的场景通常偏离由物理排列引起的理想对称系统,其特征是对称群的非平凡作用,导致影响输出的不对称,这是一种称为对称性破坏的现象。基于GCONV的传统方法受小组空间内的刚性操作规则的约束,假设数据在有限的小组转换后仍然严格对称性 ...
0 0 0 2025/09/12 arXiv:2408.11760v3 chitose
用实例感知语义和几何信息代表3D环境对于动态环境中的互动感知机器人至关重要。然而,由于传感器噪声,实例细分和跟踪错误以及对象的动态运动,创建这样的表示形式构成了挑战。本文介绍了一个基于粒子的新型实例 - 感知语义占用图,以应对这些挑战 ...
0 0 0 2025/09/12 arXiv:2409.11975v2 chenhualin
激光点云分析是3D计算机视觉的核心任务,尤其是自动驾驶。但是,由于单扫激圈云中严重的稀疏性和噪声干扰,精确的语义分割是非平凡的。在本文中,我们提出了一个新型的稀疏点云点云语义分割框架,并在上下文形状的先验中辅助 ...
0 0 0 2025/09/12 arXiv:2012.03762v1 chenhualin
当前自动驾驶中的当前感知模型在很大程度上依赖于标有3D数据的大规模,这既昂贵又耗时。这项工作提出了一种解决方案,以利用蒙版自动编码器(MAE)对大规模未标记的户外激光雷达点云进行预训练,以减少对标记的3D训练数据的依赖。虽然现有的掩盖点自动编码方法主要集中于小规模的室内点云或基于支柱的大规模室外激光雷达数据,但我们的方法引入了一种新的自助式掩盖的掩盖占用预训练方法,称为占用率,专门为Voxel基于 ...
0 0 0 2025/09/12 arXiv:2206.09900v7 chenhualin
索引讲故事在视频游戏中越来越受欢迎,叙事通过零散的线索展开。这种方法促进了玩家生成的内容和讨论,因为故事口译员将这些分散元素的总体叙述融合在一起。但是,线索的零散和非线性性质使系统的分类和解释具有挑战性,有可能阻碍有效的故事重建和创造性参与 ...
0 0 1 2025/09/12 arXiv:2503.06098v1 waterfall666
重复消费(例如回购项目和重新列出歌曲)是日常生活中的常见情况。为了建模重复消耗,已经提出了重复感知的建议,以预测哪些项目将根据用户项目的交互重新互动。在本文中,我们研究了各种固有的特征,以增强重复感知的建议 ...
0 0 0 2025/09/12 arXiv:2506.08531v1 milimiko
上下文:大型语言模型(LLM)和生成预训练的 Transformer (GPT)已改变了软件工程领域(SE)。现有的基于LLM的多代理模型已成功解决了基本对话任务。但是,在仅在现有的一些工作中,已经研究了LLMS对更具挑战性任务的潜力,例如大型和复杂项目的自动代码生成 ...
0 1 1 2025/09/12 arXiv:2402.01411v2 tucaojun
在过去的几年中,对象检测取得了巨大的成功,而目前的优秀检测器则在解决尺寸有限的实例方面努力。具体而言,先验区域和物体区域之间低重叠的众所周知的挑战导致样本池进行优化,而判别信息的匮乏进一步加剧了识别。为了减轻上述问题,我们提出了CFINET,这是一个针对基于粗到精细的管道和特征模仿学习的小物体检测而定制的两阶段框架 ...
0 0 0 2025/09/12 arXiv:2308.09534v1 Fun_James

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)