GSPLAT是一个开源库,旨在培训和开发高斯分裂方法。它具有与Pytorch库兼容的Python绑定的前端和具有高度优化的CUDA内核的后端。 GSPLAT提供了许多功能,可增强高斯脱落模型的优化,其中包括对速度,内存和收敛时间的优化改进 ...
0 0 0 2025/09/24 arXiv:2409.06765v1 Dai_Junwei
通知是提供及时和相关信息的重要通信渠道。优化其交付涉及解决在限制(例如消息实用程序和用户疲劳之类的限制)下解决复杂的顺序决策挑战。离线增强学习(RL)方法,例如保守的Q学习(CQL),已应用于此问题,但面临大规模的实际挑战,包括不稳定性,对分配变化有限的敏感性,有限的可重复性以及在高维建议环境中具有解释性的困难 ...
0 0 0 2025/09/24 arXiv:2509.02458v1 zy1111
3D代的最新进展已从多视图2D渲染方法转变为3D本地潜在扩散框架,这些框架在地面真相数据中利用了几何学先验。尽管进步,但三个关键局限性仍然存在:(1)单纬度表示未能捕获复杂的多部分几何形状,从而导致细节降解; (2)整体潜在编码忽略了零件独立性和对组成设计至关重要的相互关系; (3)全球条件机制缺乏细粒度的可控性。受到人类3D设计工作流程的启发,我们提出了Copart,这是一个部分感知的扩散框架, ...
0 0 0 2025/09/24 arXiv:2507.08772v1 wonglliam
We present Assembler, a scalable and generalizable framework for 3D part assembly that reconstructs complete objects from input part meshes and a reference image. Unlike prior approaches that mostly r ...
0 0 0 2025/09/24 arXiv:2506.17074v1 wonglliam
稀疏专家混合(SMoE)已被广泛应用于提高基于 Transformer 的基础模型的训练和推理效率,并取得了可喜的结果。然而,SMoE的性能在很大程度上取决于超参数的选择,例如专家数量和要激活的专家数量(称为top-k),由于大量的模型训练而导致显着的计算开销通过搜索各种超参数配置。作为补救措施,我们引入了专家动态混合 (DynMoE) 技术 ...
0 0 0 2025/09/24 arXiv:2405.14297v4 37220222203774
大型的多模型模型(LMM)彻底改变了文本到图像的生成,但它们有可能使培训数据中有害的社会偏见持续存在。先前的工作已经确定了这些模型中的性别偏见,但是方法论上的局限性阻止了大规模,可比的跨模型分析。为了解决这一差距,我们介绍了Aymara图像公平评估,这是评估AI生成图像中社会偏见的基准 ...
0 0 0 2025/09/24 arXiv:2509.07050v1 zy1111
我们提出了4Kagent,这是一种统一的代理超级分辨率的通才系统,旨在普遍地将任何图像提高到4K分辨率(如果迭代地应用甚至更高)。我们的系统可以将图像从具有严重降解的极低分辨率转化,例如,在256x256的高度扭曲的输入中,将图像转变为晶体清晰的,逼真的4K输出。 4Kagent包括三个核心组件:(1)分析,一个基于定制用例的4Kagent管道的模块; (2)一种感知剂,它利用视觉模型与图像质量评 ...
0 0 0 2025/09/24 arXiv:2507.07105v1 ReLU
双重编码器(DE)模型,其中一对匹配查询和文档嵌入了相似的向量表示中,由于其简单性和可扩展性,在信息检索中广泛使用。但是,嵌入空间的欧几里得几何形状限制了DES的表现力,这可能会损害其质量。本文在层次检索(HR)的背景下研究了此类局限性,其中文档集具有层次结构,查询的匹配文档都是其所有祖先 ...
0 0 0 2025/09/24 arXiv:2509.16411v1 zjwbr

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)