体素查询的分辨率显着影响基于摄像机的3D占用预测中的视图转换质量。但是,计算限制和实时部署的实际必要性需要较小的查询分辨率,这不可避免地导致信息丢失。因此,必须在有限的查询大小中编码和保留丰富的视觉细节,同时确保3D占用率的全面表示 ...
0 0 0 2025/04/15 arXiv:2503.15185v1 chenhualin
牙齿分割是现代数字牙科的关键步骤,对于正畸诊断和治疗计划的应用至关重要。尽管它很重要,但由于噪声高和2D和3D牙齿数据固有的较低对比度,因此这一过程充满了挑战。卷积神经网络(CNN)和变形金刚都在医学图像分割中都表现出了希望,但是每种方法在处理长期依赖性和计算复杂性方面都有局限性 ...
0 0 0 2025/04/15 arXiv:2404.01065v2 Theo
建立有效,高效的基于 Transformer 的大型语言模型(LLM)最近已成为研究重点,需要最大程度地提高模型语言能力并最大程度地降低培训和部署成本。现有的努力主要描述了模型性能,参数大小和数据大小之间的复杂关系,并搜索了训练LLM的最佳计算分配。但是,他们忽略了上下文长度和注意力头配置的影响(在分组疑问注意力中的查询和键值头的数量)对训练和推理的影响 ...
0 0 0 2025/04/15 arXiv:2503.09579v1 13126663453
这项工作从3D形态模型(3DMM)和3D面部标志的协同过程中学习学习,以预测完整的3D面部几何形状,包括3D对齐,面部取向和3D面部建模。我们的协同过程利用了3DMM参数和3D地标的表示周期。 3D地标可以从3DMM参数构建的面部网格中提取和改进 ...
0 0 0 2025/04/15 arXiv:2110.09772v3 No_fake
尽管人类评估仍然是开放域对话评估的黄金标准,但使用大型语言模型 (LLM) 的自动评估的日益普及也扩展到了对话领域。然而,大多数框架利用在流畅性和相关性等方面评估旧聊天机器人的基准,这并不能反映与当代模型相关的挑战。事实上,对Soda的定性分析,是GPT-3 ...
0 0 0 2025/04/15 arXiv:2408.10902v3 lisaZ
对整个状态的感知是支持物理系统的监视,分析和设计的重要技术,其挑战是从稀疏观察中恢复全球领域。深层神经网络以出色的近似能力而闻名,对数据驱动的流量和热场重建研究具有吸引力。但是,受网络结构的限制,现有研究主要学习有限维空间中的重建映射,并且可以转移到变量分辨率的输出分辨率 ...
0 0 0 2025/04/15 arXiv:2302.09808v1 wgkooo
现有的行人属性识别(PAR)算法主要是基于静态图像开发的,但是,在挑战性的情况下,诸如重型遮挡,动作模糊等的挑战性场景中的性能是不可靠的。在这项工作中,我们建议使用可以通过视频框架来理解人类属性,以通过视频框架来通过预先调整预处理的多型多模型基础模型,以充分使用时间范围。具体而言,我们将基于视频的PAR作为视觉融合问题制定,并采用预先训练的基础模型剪辑来提取视觉特征 ...
0 0 0 2025/04/15 arXiv:2404.17929v1 韩池
大型语言模型(LLM)代理在多域任务中表现出显着的概括能力。现有的代理调整方法通常在整个专家轨迹上采用监督的固定。但是,全面轨迹的行为限制会引入专家偏见,并削弱专家数据所涵盖的状态 ...
0 0 0 2025/04/15 arXiv:2503.02197v1 bage

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)