现有的知识蒸馏作用于语义细分,主要集中于将高级上下文知识从教师转移到学生。但是,低级纹理知识对于表征局部结构模式和全球统计属性(例如边界,平滑度,规律性和颜色对比度)也至关重要,这可能无法通过高级深层特征来很好地解决。在本文中,我们旨在充分利用结构和统计纹理知识,并提出一种用于语义分割的新型结构和统计纹理知识蒸馏(SSTKD)框架 ...
0 0 0 2025/03/12 arXiv:2305.03944v2 Ojuice
来自LiDar Point Clouds的城市建模是计算机视觉,计算机图形,摄影测量和遥感的重要主题。 3D城市模型在智能城市,自动导航,城市规划和映射等中发现了广泛的应用。但是,现有的3D建模数据集主要集中在常见对象(例如家具或汽车)上 ...
0 0 0 2025/03/12 arXiv:2307.11914v1 nameLZM
对称正定(SPD)矩阵学习方法在许多图像和视频处理任务中都变得流行,这要归功于他们在尊重基础SPD歧管的Riemannian几何形状的同时学习适当的统计表示。在本文中,我们构建了Riemannian网络体系结构,以在深层模型中打开SPD矩阵非线性学习的新方向。 In particular, we devise bilinear mapping layers to transform input S ...
0 0 0 2025/03/12 arXiv:1608.04233v2 Roa
随着在线投资平台的快速增长,资金可以在线分配给个人客户。核心问题是将资金与受到限制的潜在客户相匹配。大多数主流平台采用建议公式来解决问题 ...
0 0 0 2025/03/12 arXiv:2503.03165v1 zw_data
视频产生见证了重大的进步,但是评估这些模型仍然是一个挑战。视频生成的全面评估基准是必不可少的,原因有两个:1)现有指标并不完全与人类的看法保持一致; 2)理想的评估系统应提供见解,以告知视频生成的未来发展。为此,我们提出了Vbench,这是一个全面的基准套件,将“视频生成质量”剖析为特定,分层和分离的维度,每个尺寸均采用量身定制的提示和评估方法 ...
0 0 0 2025/03/12 arXiv:2411.13503v1 kevinson
慢速思维机制与大语言模型(LLMS)的集成为实现2级AGI推理器提供了一种有希望的方法,如Openai的O1这样的系统所示例。但是,仍然存在一些重大挑战,包括效率低下的过度思考和对辅助奖励模型的过度依赖。我们指出,这些局限性源于LLMS无法内部化搜索过程,这是有效推理的关键组成部分 ...
0 0 0 2025/03/12 arXiv:2502.04404v1 jueli
受人类认知双过程理论的启发,duma,这是一种新颖的对话代理框架,llm),来体现双重思维机制。快速思维模型充当外部交互和初始响应生成的主要界面 ...
0 0 0 2025/03/12 arXiv:2310.18075v4 liner
我们提出了 X-Portrait,这是一种创新的条件扩散模型,专为生成富有表现力且时间连贯的肖像动画而设计。具体来说,给定单个肖像作为外观参考,我们的目标是通过驾驶视频中的运动为其制作动画,捕捉高度动态和微妙的面部表情以及大范围的头部运动。作为其核心,我们利用预训练扩散模型的生成先验作为渲染主干,同时在 ControlNet 框架内通过新颖的控制信号实现细粒度的头部姿势和表情控制 ...
0 0 0 2025/03/12 arXiv:2403.15931v4 jeft

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)