一译 —— 文档和论文翻译、对照阅读、讨论和社区

FlashSparse: Minimizing Computation Redundancy for Fast Sparse Matrix Multiplications on Tensor Cores

稀疏的基质矩阵乘法（SPMM）和采样致密的矩阵乘法（SDDMM）是科学计算和深度学习中的重要稀疏操作员。张量核心单元（TCUS）以优越的计算能力增强了现代加速器，这有望提高矩阵操作员的性能较高。但是，由于非结构化稀疏数据的不规则性，很难在TCU上提供实用的加速 ...

0 0 0 2025/09/22 arXiv:2412.11007v1 Daenerays

LRW-1000: A Naturally-Distributed Large-Scale Benchmark for Lip Reading in the Wild

大规模数据集已连续证明了它们在几个研究领域的基本重要性，尤其是对于一些新兴主题的早期进展。在本文中，我们专注于视觉识别的问题，也称为唇读，近年来引起了人们的兴趣。我们提出了一个自然分布的大规模基准，用于野外唇读，名为LRW-1000，其中包含1,000堂课，其中包括来自2,000多名单独演讲者的718,018个样品 ...

0 0 0 2025/09/22 arXiv:1810.06990v6 瞢闇

The Promise of RL for Autoregressive Image Editing

我们探讨了三种策略，以增强各种图像编辑任务的性能：监督微调（SFT），增强学习（RL）和经过思考链（COT）推理。为了在一个一致的框架中研究所有这些组件，我们采用自回归的多模型模型，该模型以统一的方式处理文本和视觉 Token 。我们发现RL与大型多模式LLM验证仪相结合是这些策略中最有效的 ...

0 0 0 2025/09/22 arXiv:2508.01119v2 smallz

DAS3D: Dual-modality Anomaly Synthesis for 3D Anomaly Detection

事实证明，合成异常样品是自我监视的2D工业异常检测的有效策略。但是，这种方法在多模式异常检测中很少探索，尤其是涉及3D和RGB图像的方法。在本文中，我们提出了一种用于3D异常合成的新型双模式增强方法，该方法简单并且能够模仿3D缺陷的特征 ...

0 0 0 2025/09/22 arXiv:2410.09821v2 ggggggsm

Drawing2CAD: Sequence-to-Sequence Learning for CAD Generation from Vector Drawings

计算机辅助设计（CAD）生成建模正在推动工业应用的重大创新。最近的作品在从各种输入（例如点云，网格和文本描述）中创建固体模型方面显示出了显着的进步。但是，这些方法从根本上与传统的工业工作流程不同，这些工业工作流程从2D工程图纸开始 ...

0 0 0 2025/09/22 arXiv:2508.18733v5 jiangyh

HAICOSYSTEM: An Ecosystem for Sandboxing Safety Risks in Human-AI Interactions

AI代理在与人类用户和工具的互动中越来越自治，从而增加了互动安全风险。我们提出了海科系统，这是一个框架，研究了各种各样且复杂的社交互动中的AI代理安全性。 Haicosystem具有模块化的沙盒环境，该环境模拟了人类用户与AI代理之间的多转交互作用，其中AI代理配备了各种工具（e ...

0 0 0 2025/09/22 arXiv:2409.16427v4 树莓

Distributed Swarm Trajectory Optimization for Formation Flight in Dense Environments

对于空中集群，在各种场景中广泛采用规定编队导航。然而，相关的规划策略通常缺乏在杂乱环境中避开障碍物的能力。为了解决这一缺陷，我们提出了一种基于优化的方法，可确保编队飞行的无碰撞轨迹生成... ...

0 0 0 2025/09/22 arXiv:2109.07682v2 jiccy

3DIS-FLUX: simple and efficient multi-instance generation with DiT rendering

文本到图像生成中对可控输出的需求不断增长，促进了多个实体生成（MIG）的重大进步，从而使用户能够定义实例布局和属性。当前，MIG中最新的方法主要基于适配器。但是，每次发布更高级模型时，这些方法都需要重新培养一个新的适配器，从而导致大量资源消耗 ...

0 0 0 2025/09/22 arXiv:2501.05131v1 鸡腿堡

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）