llm)在通过生成信息增强我们的日常生活方面取得了巨大的成功。由于更好地符合人类意图,llm的个性化可以进一步促进其应用。对于个性化生成服务,协作云边缘方法是有前途的,因为它有助于有效编排异构分布式通信和计算资源... ...
0 0 0 2025/09/05 arXiv:2307.06148v4 HeiHuZi
大型语言模型的最新进展通过有效利用经过思考链(COT)和强化学习,从而显着改善了文本推理。但是,将这些成功扩展到视觉任务,由于仅文本cot的固有局限性,例如视觉幻觉和多模式集成不足,因此仍然具有挑战性。在本文中,我们介绍了Point-RFT,这是一种多式联运推理框架,旨在利用视觉上的COT推理来了解视觉文档的理解 ...
0 0 0 2025/09/05 arXiv:2505.19702v1 jerry_11
专家并行性已成为分配跨多个设备的稀疏门控混合物(MOE)模型的计算工作量的关键策略,从而实现了日益大型模型的处理。但是,专家并行性固有的全部沟通构成了重要的瓶颈,从而限制了MOE模型的效率。尽管现有的优化方法部分缓解了此问题,但它们仍受到通信和计算操作之间的顺序依赖性的限制 ...
0 0 0 2025/09/05 arXiv:2404.05019v3 白日衣衫尽
人类开发人员的基本技能是能够理解和推理程序执行的能力。例如,程序员可以在心理上模拟自然语言的代码执行,以调试和维修代码(又称橡皮鸭调试) ...
0 0 0 2025/09/05 arXiv:2404.14662v1 woodman
在视觉建模中,通常对评论家模型进行培训,以评估输出 - 分配标量分数或成对的偏好 - 而不是生成响应。与产生回应的政策模型的这种分离是如此根深蒂固,以至于很少考虑批评者以供直接政策使用。在这项工作中,我们挑战了这一公约 ...
0 0 0 2025/09/05 arXiv:2509.00676v1 liht
与现有的基于基于NERF的隐式表示框架相比,我们介绍了一个3D人类的Gauhuman,这是一个3D人类模型,具有高斯碎片(1〜2分钟)和实时渲染(最高为189 fps)(最高为189 fps)(最高为189 fps)。具体而言,高人类编码在规范空间中的高斯碎片,并将3D高斯人从规范空间转变为带有线性混合皮肤(lbs)的姿势空间,其中有效的姿势和lbs细化模块旨在学习可忽略的计算成本下3D人类的细节 ...
0 0 0 2025/09/05 arXiv:2312.02973v1 sycamore
有效的视频编码高度取决于利用时间冗余,通常通过在基于条件编码的神经视频编解码器(NVC)中提取和利用时间上下文来实现。尽管最新的NVC在改善压缩性能方面取得了显着进步,但固有的时间上下文传播机制缺乏足够利用参考信息的能力,从而限制了进一步的改进。在本文中,我们通过用两个步骤调制参考框架来解决限制 ...
0 0 0 2025/09/05 arXiv:2505.14541v1 1150501302
听诊仍然是临床实践的基石,对于初始评估和持续监测至关重要。临床医生通过结合患者的病史和测试结果来聆听肺部声音并诊断。鉴于这种牢固的关联,多任务学习(MTL)可以提供一个令人信服的框架,以同时对这些关系进行建模,将呼吸道模式与疾病表现相结合 ...
0 0 0 2025/09/05 arXiv:2505.06271v1 zzr123456

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)