一译 —— 文档和论文翻译、对照阅读、讨论和社区

Structural and Statistical Texture Knowledge Distillation for Semantic Segmentation

现有的知识蒸馏作用于语义细分，主要集中于将高级上下文知识从教师转移到学生。但是，低级纹理知识对于表征局部结构模式和全球统计属性（例如边界，平滑度，规律性和颜色对比度）也至关重要，这可能无法通过高级深层特征来很好地解决。在本文中，我们旨在充分利用结构和统计纹理知识，并提出一种用于语义分割的新型结构和统计纹理知识蒸馏（SSTKD）框架 ...

0 0 0 2025/03/12 arXiv:2305.03944v2 Ojuice

Building3D: An Urban-Scale Dataset and Benchmarks for Learning Roof Structures from Point Clouds

来自LiDar Point Clouds的城市建模是计算机视觉，计算机图形，摄影测量和遥感的重要主题。 3D城市模型在智能城市，自动导航，城市规划和映射等中发现了广泛的应用。但是，现有的3D建模数据集主要集中在常见对象（例如家具或汽车）上 ...

0 0 0 2025/03/12 arXiv:2307.11914v1 nameLZM

A Riemannian Network for SPD Matrix Learning

对称正定（SPD）矩阵学习方法在许多图像和视频处理任务中都变得流行，这要归功于他们在尊重基础SPD歧管的Riemannian几何形状的同时学习适当的统计表示。在本文中，我们构建了Riemannian网络体系结构，以在深层模型中打开SPD矩阵非线性学习的新方向。 In particular, we devise bilinear mapping layers to transform input S ...

0 0 0 2025/03/12 arXiv:1608.04233v2 Roa

A Predict-Then-Optimize Customer Allocation Framework for Online Fund Recommendation

随着在线投资平台的快速增长，资金可以在线分配给个人客户。核心问题是将资金与受到限制的潜在客户相匹配。大多数主流平台采用建议公式来解决问题 ...

0 0 0 2025/03/12 arXiv:2503.03165v1 zw_data

VBench++: Comprehensive and Versatile Benchmark Suite for Video Generative Models

视频产生见证了重大的进步，但是评估这些模型仍然是一个挑战。视频生成的全面评估基准是必不可少的，原因有两个：1）现有指标并不完全与人类的看法保持一致； 2）理想的评估系统应提供见解，以告知视频生成的未来发展。为此，我们提出了Vbench，这是一个全面的基准套件，将“视频生成质量”剖析为特定，分层和分离的维度，每个尺寸均采用量身定制的提示和评估方法 ...

0 0 0 2025/03/12 arXiv:2411.13503v1 kevinson

Step Back to Leap Forward: Self-Backtracking for Boosting Reasoning of Language Models

慢速思维机制与大语言模型（LLMS）的集成为实现2级AGI推理器提供了一种有希望的方法，如Openai的O1这样的系统所示例。但是，仍然存在一些重大挑战，包括效率低下的过度思考和对辅助奖励模型的过度依赖。我们指出，这些局限性源于LLMS无法内部化搜索过程，这是有效推理的关键组成部分 ...

0 0 0 2025/03/12 arXiv:2502.04404v1 jueli

DUMA: a Dual-Mind Conversational Agent with Fast and Slow Thinking

受人类认知双过程理论的启发，duma，这是一种新颖的对话代理框架，llm），来体现双重思维机制。快速思维模型充当外部交互和初始响应生成的主要界面 ...

0 0 0 2025/03/12 arXiv:2310.18075v4 liner

X-Portrait: Expressive Portrait Animation with Hierarchical Motion Attention

我们提出了 X-Portrait，这是一种创新的条件扩散模型，专为生成富有表现力且时间连贯的肖像动画而设计。具体来说，给定单个肖像作为外观参考，我们的目标是通过驾驶视频中的运动为其制作动画，捕捉高度动态和微妙的面部表情以及大范围的头部运动。作为其核心，我们利用预训练扩散模型的生成先验作为渲染主干，同时在 ControlNet 框架内通过新颖的控制信号实现细粒度的头部姿势和表情控制 ...

0 0 0 2025/03/12 arXiv:2403.15931v4 jeft

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）