对资源约束设备的有效LLM推断在计算和内存利用方面提出了重大挑战。由于GPU内存有限,现有系统将模型权重卸载到CPU内存,从而在CPU和GPU之间产生了大量的I/O开销。这导致了两个主要的效率低下:(1)GPU核心未被充分利用,在等待数据加载时通常保持闲置; (2)GPU内存对性能的影响很小,因为降低其容量对本文的总体影响最小,我们建议SpecOffload,这是一种高通量推进引擎,将投机性解码嵌 ...
个性化模型在理解和生成用户提供的概念方面取得了显着成功。但是,现有方法使用单独的概念 Token 进行理解和生成,并孤立地处理这些任务。这可能会导致生成具有复杂提示的图像的局限性 ...
知识库问答(KBQA)是一个基于知识库回答问题的长期领域。最近,知识的动态发展引起了人们对时态知识图问答(TKGQA)日益增长的兴趣,这是一种回答时态问题的新兴任务。然而,该领域在定义时间问题方面存在模糊性,并且缺乏对现有 TKGQA 方法的系统分类 ...
大型视觉模型具有固有的功能来处理各种视觉感知任务。在本文中,我们介绍了VisionReasoner,这是一个统一的框架,能够在共享模型中推理和解决多个视觉感知任务。具体而言,通过设计新颖的多对象认知学习策略和系统的任务重新重新制定,VisionReasoner增强了其推理能力以分析视觉投入,并在统一框架中解决了各种知觉任务 ...
零和少数视觉异常分段依赖于强大的视觉语言模型,这些模型使用手动设计的文本提示来检测看不见的异常。但是,视觉表示本质上独立于语言。在本文中,我们探讨了纯视觉基础模型的潜力,以替代广泛使用的视觉模型,用于通用视觉异常分割 ...
大型语言模型(LLMS)通常很难使他们的回答与客观事实保持一致,从而导致事实幻觉问题,这可能很难在没有相关知识的情况下检测和误导用户。尽管已采用后培训技术来减轻问题,但现有方法通常会遭受不同能力的概括和权衡的差。在本文中,我们建议通过直接增强LLM精确利用其现有记忆的基本能力来解决它 - 从培训前数据中获得的知识 ...
推荐系统(RS)已成为在各种现实世界情景下进行信息过滤的关键工具。近年来,已经广泛探索了跨域建议(CDR),以便在其他领域的帮助下在目标域中提供更好的建议结果。 CDR技术已经迅速发展,但缺乏全面的调查总结了最近的作品 ...
关系提取(RE)是自然语言处理中的一项基本任务,旨在识别文本中的目标实体之间的关系。尽管许多RE方法是为单个句子或文档设计的,但跨文档RE已出现以解决多个长文档之间的关系。鉴于跨文档中长文档的性质,由于预训练的语言模型的长度限制,提取文档嵌入是具有挑战性的 ...