受大规模语言建模进度的启发,我们采用类似的方法来构建文本输出领域之外的单一通才代理。我们称为Gato的代理商是一种多模式,多任务,多任务的通才政策。具有相同权重的同一网络可以播放Atari,字幕图像,聊天,带有真正的机器人臂的堆栈块等等,根据其上下文决定是否输出文本,联合扭矩,按钮按下或其他 Token  ...
0 0 0 2025/05/29 arXiv:2205.06175v3 kkkk
基于物理的渲染材料(PBR)材料在现代图形中起着至关重要的作用,从而实现了跨不同环境图的逼真的渲染。开发一种能够自动生成高质量PBR材料而不是RGB纹理的有效且有效的算法,可以显着简化3D内容创建。大多数现有方法利用预先训练的2D扩散模型进行多视图图像合成,这通常会导致生成的纹理和输入3D网格之间的严重不一致 ...
0 0 0 2025/05/29 arXiv:2411.19654v2 zhifeiji
现有的自动及时工程方法通常是为判别任务而设计的,其中新任务提示是通过反映单个方面的单个度量的有限反馈进行迭代精制的。但是,这些方法对于生成任务是次优的,除了单个数字指标之外,需要更细微的指导来改善及时的及时,并优化了生成的文本的多个方面。为了应对这些挑战,我们提出了一种新型的多种批评 - 斗争引导自动及时优化(CRISPO)方法 ...
0 0 0 2025/05/29 arXiv:2410.02748v3 NoelYin
该技术报告介绍了Qwenlong-CPR,这是一种旨在显式长篇文本优化的上下文压缩框架,在预填充阶段期间针对高度的计算开销,以及在长序列处理中大型语言模型(LLMS)的“中间”性能退化。 Qwenlong-CPR通过新颖的动态上下文优化机制实施,可实现以自然语言指导为指导的多界面上下文,从而实现了效率的提高和提高的性能。 Qwenlong-CPR从QWEN Architecture系列演变而来,引 ...
0 0 0 2025/05/29 arXiv:2505.18092v2 wonders
将模拟中学到的政策转移到现实世界中是一种有前途的策略,用于大规模获取机器人技能。但是,SIM到现实的方法通常依赖于任务奖励函数的手动设计和调整以及模拟物理参数,从而使过程缓慢而人类限制。在本文中,我们使用大型语言模型(LLM)进行调查以自动化和加速SIM到现实的设计 ...
0 0 0 2025/05/29 arXiv:2406.01967v1 yydsdsyy
最近零样本关系提取 (RE) 的研究主要集中在使用大型语言模型 (LLM),因为它们具有令人印象深刻的零样本功能。然而,当前的方法通常表现不佳,主要是由于缺乏理解各种句子和关系所需的详细的、特定于上下文的提示。为了解决这个问题,我们引入了自我提示框架,这是一种旨在充分利用 LLM 中嵌入的 RE 知识的新颖方法 ...
0 0 0 2025/05/29 arXiv:2410.01154v2 spiritedge
深度学习应用程序(DL)应用程序广泛采用了无服务器计算,其易于管理,自动缩放和成本效益。 DL工作负载,尤其是使用大型语言模型,需要大量的GPU资源来确保QoS。但是,很容易产生GPU碎片(e ...
0 0 0 2025/05/29 arXiv:2503.05130v1 tianjianjjj
我们提出了一条简单而有效的管道,用于对3D场景进行样式化,利用2D图像扩散模型的功能。给定一个从一组多视图图像重建的NERF模型,我们通过使用由样式与样式的图像到图像扩散模型生成的风格化图像来完善源NERF模型来执行3D样式传输。考虑到目标样式提示,我们首先通过利用带有注意力共享机制的深度条件扩散模型来生成相似的多视图图像 ...
0 0 0 2025/05/29 arXiv:2406.13393v3 zhifeiji

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)