一译 —— 文档和论文翻译、对照阅读、讨论和社区

Concept Decomposition for Visual Exploration and Inspiration

一个创意的想法通常是由于从现有的视觉示例中转变，结合和修改捕获各种概念的想法而诞生的。但是，不能简单地将这个概念复制为一个整体，而灵感是通过检查概念的某些方面来实现的。因此，通常有必要将一个概念分为不同方面，以提供新的观点 ...

0 0 0 2025/09/01 arXiv:2305.18203v2 qiuyan

Video Multimethod Assessment Fusion (VMAF) on 360VR contents

本文介绍了主观实验和随后的分析，以验证最强大，最有影响力的视频质量指标之一，视频多方法评估融合（VMAF）的应用到360VR内容。 VMAF是最初旨在与传统2D内容一起使用的完整参考度量。因此，首先，不能认为它与使用头部安装的显示（HMD）可视化的方案的特殊性兼容 ...

0 0 0 2025/09/01 arXiv:1901.06279v1 ReLU

CUDA-L1: Improving CUDA Optimization via Contrastive Reinforcement Learning

对GPU计算资源需求的指数增长已经迫切需要自动化的CUDA优化策略。尽管LLM的最新进展显示出对代码生成的希望，但当前的SOTA模型在提高CUDA速度方面取得了较低的成功率。在本文中，我们介绍了CUDA-L1，这是一种用于CUDA优化的自动增强学习框架，采用了一种新型的对比度RL算法 ...

0 0 0 2025/09/01 arXiv:2507.14111v7 tianjianjjj

Missile: Fine-Grained, Hardware-Level GPU Resource Isolation for Multi-Tenant DNN Inference

将高优先级，延迟敏感（LS）和低优先级，最佳（BE）DNN推理服务降低了GPU集群的总拥有成本（TCO）。受VRAM渠道冲突和PCIE总线论点等瓶颈的限制，现有的GPU共享解决方案无法避免并发执行任务之间的资源冲突，无法实现LS任务的低延迟和对任务的高吞吐量。为了弥合这一差距，本文介绍了导弹，这是GPU的一般共享解决方案，用于对NVIDIA GPU的多租户DNN推断 ...

0 0 0 2025/09/01 arXiv:2407.13996v3 gigi

Approximate Top-$k$ for Increased Parallelism

我们提出了对桶式近似$ K $算法的评估。恰好计算最高的$ k $具有有限的并行性，因为$ k $最大的值必须沿向量汇总，因此不太适合在高度并行的机器学习加速器上计算。通过放松顶部$ K $的要求，可以通过独立计算许多较小的上$ K $操作来大大增加可用的并行性 ...

0 0 0 2025/09/01 arXiv:2412.04358v1 Daenerays

Self-Rewarding Vision-Language Model via Reasoning Decomposition

视觉语言模型（VLMS）经常患有视觉幻觉，说出实际上不在图像中的事情和语言快捷方式，它们跳过视觉部分，只是依靠文本先验。这些问题之所以出现，是因为VLMS的大多数训练后培训方法都依赖于简单可验证的答案匹配并仅监督最终输出，而中间视觉推理没有明确的指导。结果，VLM会收到稀疏的视觉信号，并经常学会优先考虑基于语言的推理而不是视觉感知 ...

0 0 0 2025/09/01 arXiv:2508.19652v1 aries_young

GLM-4.5V and GLM-4.1V-Thinking: Towards Versatile Multimodal Reasoning with Scalable Reinforcement Learning

我们提出GLM-4.1V思维，这是一种旨在推进通用多种模束推理的视觉模型（VLM）。 In this report, we share our key findings in the development of the reasoning-centric training framework. ...

0 0 0 2025/09/01 arXiv:2507.01006v5 bage

Advances in Small-Footprint Keyword Spotting: A Comprehensive Review of Efficient Models and Algorithms

小英尺打印的关键字发现（SF-KWS）在当今智能语音激活设备，智能手机和物联网（IoT）应用程序的景观中广受欢迎。这种激增归因于深度学习的进步，从而可以从连续的单词流中识别预定义的单词或关键字。在现实情况下，在具有低功率和有限内存的边缘设备上实现SF-KWS模型，有效的微型机器学习（Tinyml）框架至关重要 ...

0 0 0 2025/09/01 arXiv:2506.11169v1 ygsx

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）