端到端的人类动画,例如音频驱动的人类一代,在最近几年中取得了显着的进步。但是,现有的方法仍然很难扩大作为大型一般视频生成模型的扩展,从而限制了它们在实际应用中的潜力。在本文中,我们提出了Omnihuman,这是一种基于扩散 Transformer 的框架,可通过将与运动相关条件混合到训练阶段来扩展数据 ...
将尖峰神经网络(SNN)与 Transformer 结构相结合的尖峰 Transformer ,由于其能源效率和高性能的潜力,引起了极大的关注。但是,该领域中的现有模型仍然遭受次优性能。我们介绍了几项创新以提高性能:i)我们提出了一种针对SNN的新型尖峰Q-K注意机制,该机制有效地通过具有线性复杂性的二进制向量来建模 Token 或通道尺寸的重要性 ...
很多LLM任务都是大批量甚至离线执行的,其性能指标就是吞吐量。这些任务通常表现出前缀共享的特点,不同的提示输入可以部分地显示公共前缀。然而,现有的LLM推理引擎倾向于优化流请求,并且在支持具有前缀共享特性的大批量任务方面表现出局限性 ...
许多实用的视觉语言应用都需要了解否定的模型,例如,当使用自然语言检索包含某些对象而不是其他对象的图像时 ...
大型语言模型 (LLM) 因其理解上下文和执行逻辑推理的能力而彻底改变了自然语言处理、计算机视觉和多模式任务等广泛领域。然而, LLM 的计算和内存需求,特别是在推理过程中,在将其扩展到现实世界、长上下文和实时应用程序时提出了重大挑战。键值 (KV) 缓存管理已成为一种关键的优化技术,可通过减少冗余计算和提高内存利用率来加速 LLM 推理 ...
深层神经网络,同时在各种任务中取得了巨大的成功,需要大量资源,包括计算,GPU内存,带宽,存储和能量。网络量化是一种标准压缩和加速技术,可降低存储成本,并通过将网络权重和激活离散为有限的整数值来实现潜在的推理加速度。但是,当前的量化方法通常是复杂且敏感的,需要广泛的特定于任务的超参数,即使单个错误配置也会损害模型性能,从而限制了不同模型和任务的一般性 ...
由于其尖峰驱动的范式,尖峰神经网络正在成为传统人工神经网络的一种有希望的节能替代品。但是,在SNN领域的最新研究主要集中在设计大规模 Transformer 结构,该结构通常依赖于大量的计算资源,从而将其部署限制在资源受限的设备上。为了克服这一挑战,我们提出了一个量化的SPIKE驱动的 Transformer 基线(QSD-Transformer),该基线通过使用低宽度参数来实现资源需求减少 ...
现实世界中的开放域问题可能很复杂,尤其是在回答问题时涉及来自多个信息源的信息。 LLM在将复杂的任务分解为更简单的步骤中表现出了令人印象深刻的性能,并且以前的工作将其用于更好地检索复杂问题。但是,LLM对问题的分解并不意识到可用的数据以及如何组织数据,通常会导致次优的检索性能 ...
在采购领域的起草逐渐变得更加复杂和多样化,这是由于满足法律要求,适应技术进步并满足利益相关者需求的需求所驱动的。尽管大型语言模型(LLM)在文档生成中显示出潜力,但大多数LLM都缺乏采购方面的专业知识。为了解决这一差距,我们使用检索提升的技术来实现专业文档的生成,以确保在采购文档中的准确性和相关性 ...
我们介绍了一种检索方法,利用支持向量回归(SVR)合奏,引导程序聚合(装袋)和嵌入德国数据集上的空间以进行法律信息检索(Gerdalir)。通过用多个二元针中的子任务概念化检索任务,我们显示出比基线的回忆改进(0.849> 0 ...