在零件级别生成3D形状对于下游应用程序(例如网状复位,紫外线映射和3D打印)至关重要。但是,现有的基于部分的生成方法通常缺乏足够的可控性,并且具有较差的语义有意义的分解。为此,我们介绍了X-Part,这是一种可控的生成模型,旨在将整体3D对象分解为具有高几何忠诚度的语义有意义且结构相干的部分 ...
0 0 0 2025/09/29 arXiv:2509.08643v2 wonglliam
特定区域的3D本地编辑对于游戏行业和机器人互动至关重要。最近的方法通常编辑渲染的多视图图像,然后重建3D模型,但它们在精确保存未编辑的区域和整体连贯性方面面临挑战。受结构化3D生成模型的启发,我们提出了Voxhammer,这是一种新型的无训练方法,在3D潜在空间中执行精确且连贯的编辑 ...
0 0 0 2025/09/29 arXiv:2508.19247v1 wonglliam
使用大型语言模型(LLM)生成语义特征已被证明是增强顺序推荐系统(SRS)的强大范式。这通常涉及三个阶段:处理项目文本,使用LLM提取功能,并将其调整以进行下游模型。但是,现有方法在提示,体系结构和适应策略方面差异很大,因此很难公平地比较设计选择并确定真正驱动性能的方法 ...
0 0 0 2025/09/29 arXiv:2509.14979v2 lyq1
图数据库已成为管理复杂和互连数据的基本工具,在社交网络,生物信息学和推荐系统等领域很常见。与传统的关系数据库不同,图形数据库提供了一种更自然的方式来建模和查询复杂的关系,这使得它们对于需要灵活性和效率在处理互连数据的应用程序中特别有效。尽管使用越来越多,但图形数据库仍面临着显着的挑战 ...
0 0 0 2025/09/29 arXiv:2505.24758v2 13987873022
生成的AI图像的出现完全破坏了艺术界。区分AI产生的图像与人类艺术是一个具有挑战性的问题,其影响会随着时间的流逝而增长。无法解决这个问题的情况使坏演员欺骗了为人类艺术支付保费的人和所规定的政策禁止AI图像的公司 ...
0 0 0 2025/09/29 arXiv:2402.03214v3 15966829631
大型人工智能模型(LAIM),特别是扩散模型和大型语言模型的快速发展,引发了人工智能生成的多媒体越来越多地全球化的各个方面的新时代。尽管这些内容在许多领域都有益,但也带来了重大风险,包括潜在的暴利、社会混乱和道德问题。,检测LAIM生成的多媒体整合至关重要,相关研究显着增加... ...
0 0 0 2025/09/29 arXiv:2402.00045v7 15966829631
我们提出了Vilbert(视觉和语言BERT的缩写),这是一种学习图像内容和自然语言的任务无关联合表示的模型。我们将流行的BERT体系结构扩展到多模式的两流模型,在单独的流中通过共同注意力 Transformer 层相互作用的单独流中的视觉和文本输入。我们通过在大型,自动收集的概念标题数据集上的两个代理任务预处理模型,然后将其转移到多个已建立的视觉和语言任务中 - 视觉问题回答,视觉共识推理,引用 ...
0 0 0 2025/09/29 arXiv:1908.02265v1 yichaowu
大语言模型(LLM)的快速发展促使人们需要越来越复杂的推理管道和硬件平台。现代LLM服务范围超出​​了传统的预填充工作流程,并结合了多阶段的过程,例如检索增强生成(RAG),键值(KV)缓存检索,动态模型路由和多步推理。这些阶段表现出各种计算需求,需要将GPU,ASIC,CPU和以内存为中心的体系结构整合的分布式系统 ...
0 0 0 2025/09/29 arXiv:2504.09775v3 tongxianhui

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)