在数字内容创建的领域中,从单个图像中产生高质量的3D字符是具有挑战性的,尤其是考虑到各种身体姿势的复杂性以及自我批判性和姿势歧义的问题。在本文中,我们介绍了字符,该框架开发了有效生成3D字符的框架。 TraceGen引入了简化的生成管道以及图像条件的多视图扩散模型 ...
在障碍环境中,连接的多机器人机器人系统(MRS)容易陷入僵局,在障碍环境中,在平稳的低级控制政策下,机器人可以将机器人从所需的位置陷入困境。没有外部干预,通常就高级命令而言,低级控制策略无法解决此类僵局。利用基础模型的普遍性和低数据要求,本文探讨了使用基于文本模型的可能性 ...
利用变分自动编码器 (VAE) 等网络进行视频时空压缩,在 OpenAI 的 SORA 和许多其他视频生成模型中发挥着至关重要的作用。例如,许多类似 LLM 的视频模型学习从 VQVAE 框架内的 3D VAE 派生的离散标记的分布,而大多数基于扩散的视频模型捕获由 2D VAE 提取的连续潜在特征的分布,而无需量化。时间压缩简单地通过均匀帧采样来实现,这导致连续帧之间的运动不平滑 ...
SARS-COV-2是一种上呼吸系统RNA病毒,截至2021年5月,全球造成了超过300万人的死亡,并感染了超过1.5亿的死亡。迄今为止,成千上万的菌株对迄今为止进行了测序,SARS-COV-2突变对科学家构成了巨大的挑战,在与疫苗开发和公共卫生措施保持同步和公共卫生测量方面有关。因此,一种有效的方法来鉴定实验室样本与患者的差异,将极大地有助于记录SARS-COV-2基因组学的文献 ...
使用多时间遥感图像进行细微的城市变化细分,对于理解城市地区的人类环境相互作用至关重要。尽管在高质量的土地覆盖数据集中取得了进步,这些数据集揭示了城市景观的物理特征,但缺乏细颗粒的土地使用数据集阻碍了人们对人类活动在整个景观中的分布以及这些活动对环境的影响的更深入的了解,从而限制了适当的技术开发。为了解决这个问题,我们介绍了FUSU,这是第一个细颗粒的土地使用变化细分数据集,以实现细粒度的城市语义理 ...
我们研究了大规模3D点云的有效语义细分问题。通过依靠昂贵的抽样技术或计算重量的预/后处理步骤,大多数现有方法只能通过小规模点云进行培训和操作。在本文中,我们介绍了Randla-Net,这是一种有效且轻巧的神经结构,可直接推断大型点云的每点语义 ...
扩散模型已通过将离散文本映射到连续空间中成功地适应了文本生成任务。但是,由于推理过程中没有前进过程,训练和推理之间存在不可忽略的差距。因此,该模型仅根据先前生成的反向噪声而不是前向过程计算的噪声进行预测 ...
从外部来源检索到的内容,以检索出来的措施,以利用下游任务中大型语言模型的性能。过多的检索内容,其部分的可能分散或焦点范围可能会发生,但最终可能会产生有害而不是增量效应。为了减轻此问题并改善检索功能的生成,我们提出了一种通过诉诸于元启动优化的提示,在提示中包含在提示中之前的检索内容 ...