随着专家型混合物(MOE)模型的广泛采用,对对内存约束设备有效推断的需求不断增长。虽然将专家参数卸载到CPU内存并按需加载激活的专家已成为潜在解决方案,但激活的专家的大型专家跨越了有限的PCIE带宽,从而阻碍了潜伏期敏感的场景的有效性。为了减轻这种情况,我们提出了Floe,这是一种在内存约束的GPU上的即时MOE推理系统 ...
我们表明,现有的UPSMPLING运算符可以通过索引函数的概念统一。该概念的灵感来自于对深图像垫的解码过程中的观察,其中指导的未解决的不足可以比其他UPSPAIMPLING OPTIONER(例如双线性插值)更好地恢复边界细节。通过将索引视为功能图的函数,我们介绍了学习索引的概念,并提出了一个新颖的索引引导的编码器框架框架,其中索引从数据中自适应地自我学习,并用于指导汇总和上下采样操作员,而无需进 ...
知识图(kgs)与大语言模型(LLMS)的集成为改善检索增强生成(RAG)系统的检索阶段提供了重要潜力。在这项研究中,我们提出了KG-CQR,这是一个新型的上下文查询检索框架(CQR),该框架通过使用以语料库为中心的kg丰富复杂输入查询的上下文表示来增强检索阶段。与主要解决语料库级上下文损失的现有方法不同,KG-CQR专注于通过结构化关系表示,提取和完成相关的KG子图以生成语义上丰富的查询环境 . ...
3D高斯碎片(3DGS)通过利用一组3D高斯原始原始人进行渲染,从而从多视图图像中重建了复杂的数字3D资产。它的明确和离散表示促进了复杂数字世界的无缝组成,比以前的神经隐式方法具有显着优势。但是,当应用于大规模作品(例如人群级场景)时,它可以包含众多3D高斯人,对实时渲染提出了重大挑战 ...
大型推理模型(LRMS)的出现通过在数学解决问题和代码生成等复杂任务中出色,从而改变了自然语言处理。这些模型利用了经过思考链(COT)过程,使它们能够模仿类似人类的推理策略。但是,缺乏全面的COT数据集阻碍了LRMS的进步 ...
大型语言模型(LLMS)在某些安全限制下产生与人类一致的内容。但是,当前已知的技术``越狱提示''可以规避安全一致的措施,并引起LLMS输出恶意内容。越狱的研究可以帮助确定LLM中的漏洞,并指导强大的安全框架的发展 ...
最近在机器人领域,视觉-语言-动作(VLA)模型作为一种变革性方法出现,使机器人能够通过在端到端学习框架内集成视觉和语言输入来执行复杂的任务。虽然 VLA 模型提供了重要的功能,但它们也引入了新的攻击面,使其容易受到对抗性攻击。由于这些漏洞基本上未被探索,本文系统地量化了基于 VLA 的机器人系统的鲁棒性 ...
现有的文本对图像扩散模型表现出在产生以文本提示为指导的高质量图像中的显着功能。但是,通过精确的空间控制实现多主体组成合成仍然是一个重大挑战。在这项工作中,我们解决了可控制的多主体合成(LMS)的任务,该任务既需要忠实地重建参考主体及其在统一图像中指定区域中的准确位置 ...