扩散模型在图像生成、编辑和修复方面显示出了显着的效果。最近的工作探索了使用神经隐函数生成 3D 形状的扩散模型,即 ...
0 0 0 2024/05/03 arXiv:2404.06851v1 ForrestPi
我们提出了 MeshLRM,这是一种基于 LRM 的新颖方法,可以在不到一秒的时间内仅从四个输入图像中重建高质量的网格。与之前专注于基于 NeRF 重建的大型重建模型 (LRM) 不同,MeshLRM 在 LRM 框架内结合了可微分网格提取和渲染。这允许通过使用网格渲染微调预先训练的 NeRF LRM 来进行端到端网格重建 ...
0 0 0 2024/05/03 arXiv:2404.12385v1 ForrestPi
物理真实材质对于在各种应用和照明条件下增强 3D 资产的真实感至关重要。然而,现有的 3D 资产和生成模型通常缺乏真实的材料属性。使用图形软件手动分配材料是一项乏味且耗时的任务 ...
0 0 0 2024/05/03 arXiv:2404.16829v2 ForrestPi
在这项工作中,我们讨论构建高性能的多模式大型语言模型(MLLM)。我们特别研究了各种架构组件和数据选择的重要性。通过对图像编码器、视觉语言连接器和各种预训练数据选择的仔细和全面的消融,我们确定了几个关键的设计经验教训 ...
0 0 0 2024/05/02 arXiv:2403.09611v4 wuweiqun
传统的人类反馈强化学习 (RLHF) 方法依赖于 Bradley-Terry 模型等参数模型,无法捕捉人类偏好中的不及物性和非理性。最近的进展表明,直接使用偏好概率可以更准确地反映人类偏好,从而实现更灵活和准确的语言模型对齐。在本文中,我们提出了一种基于自我博弈的语言模型对齐方法,该方法将问题视为恒定和两人博弈,旨在确定纳什均衡策略 ...
0 0 0 2024/05/02 arXiv:2405.00675v1 xiruo12
为了在不确定的环境中安全地进行规划,智能体必须平衡效用与安全约束。安全规划问题可以建模为机会受限的部分可观察马尔可夫决策过程 (CC-POMDP),解决方案通常使用昂贵的推出或启发式方法来估计最优值和行动选择策略。这项工作引入了 ConstrainedZero 策略迭代算法,该算法通过学习最优值和策略的神经网络近似值来解决置信空间中的 CC-POMDP,并使用额外的网络头来估计给定置信的故障概率  ...
0 0 0 2024/05/02 arXiv:2405.00644v1 xiruo12
预训练的上下文嵌入是用于结构化预测任务的强大单词表示。最近的工作发现,通过连接不同类型的嵌入可以获得更好的单词表示。然而,选择嵌入来形成最佳串联表示通常会根据任务和候选嵌入的集合而变化,并且嵌入类型数量的不断增加使其成为一个更加困难的问题 ...
0 0 0 2024/05/02 arXiv:2010.05006v4 leizhengtao520
从非结构化文本中智能地提取和链接复杂的科学信息是一项具有挑战性的工作,特别是对于那些缺乏自然语言处理经验的人来说。在这里,我们提出了一种简单的序列到序列方法,用于科学文本中复杂分层信息的联合命名实体识别和关系提取。该方法利用预先训练的大型语言模型 (LLM) GPT-3,该模型针对大约 500 对提示(输入)和完成(输出)进行了微调 ...
0 0 0 2024/05/02 arXiv:2212.05238v1 slices

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)