会话推荐系统(CRS)已成为通过自然语言对话提供个性化建议的变革性范式。但是,由于用户通常会提供简短的,不完整的偏好陈述,因此他们面临着知识稀疏性的挑战。尽管最近的方法已经整合了外部知识来源来减轻这种情况,但他们仍然在语义理解和复杂的偏好推理上挣扎 ...
计算存在巨大的内存问题。记忆系统由不同级别的多种技术组成,负责大多数能源消耗,性能瓶颈,健壮性问题,货币成本以及现代计算系统的硬件房地产。随着现代和新兴应用变得更加数据密集型(正如我们在e中见证的那样,这一切都变得更糟 ...
大型语言模型的最新进展已经证明了思想链(COT)和增强学习(RL)如何改善性能。但是,将这种推理策略应用于视觉生成领域仍然没有探索。在本文中,我们提出了T2i-R1,这是一种新型推理增强的文本对图像生成模型,由RL提供双层COT推理过程 ...
尽管网络稀疏性在减轻大语言模型(LLMS)的部署应变方面具有功效,但它仍会承受重大的性能降低。应用低级适应(LORA)来微调稀疏的LLMS提供了一种直观的方法来应对这种困境,而它却存在缺点,包括:1)无法将Lora重量整合到稀疏的LLMS训练后,而2)在高弹药率下的性能恢复不足。在本文中,我们引入了动态低级稀疏适应性(LOSA),这是一种新颖的方法,它无缝地将低级适应性整合到统一框架内的LLM稀疏 ...
高光谱图像(HSIS)在成像过程中通常会遭受多种和未知的降解,导致严重的光谱和空间扭曲。现有的HSI恢复方法通常依赖于特定的降解假设,从而在复杂的情况下限制了它们的有效性。在本文中,我们提出了MP-HSIR,这是一种新型的多项目框架,可有效整合光谱,文本和视觉提示,以实现跨不同降解类型和强度的通用HSI恢复 ...
在3D Vision中,建模和重新渲染动态3D场景是一项艰巨的任务。先前的方法基于NERF并依赖于隐式表示。这很慢,因为它需要许多MLP评估,从而限制了现实世界的应用程序 ...
随着AI聊天机器人无处不在,语音互动提出了一种令人信服的方式,可以为语义和社会信号提供快速,高带宽的沟通。这将大型音频模型(LAM)的研究推向了语音本地体验。但是,将LAM开发与用户目标保持一致需要清楚地了解用户需求和偏好以建立可靠的进度指标 ...
连续的测试时间适应(CTTA)试图适应源预先训练的模型,以不断改变,看不见的目标域。尽管现有的CTTA方法假设结构化域随均匀持续时间的变化而变化,但现实世界的环境经常显示动态模式,其中域以不同的频率和持续时间复发。当前的方法是在这种动态条件下对不同领域的相同参数进行调整的方法 - 他们面临着融合问题,并与短暂的域暴露,风险忘记先前学到的知识或将其误用到无关的领域 ...