大型语言模型(LLM)在各种任务中取得了令人印象深刻的成果,但与幻觉问题和缺乏相关知识作斗争,特别是在深度复杂推理和知识密集型任务中。知识图(KG)以结构化格式捕获大量事实,为推理提供了可靠的知识来源。然而,现有的基于KG的LLM推理方法面临着处理多跳推理、多实体问题以及有效利用图结构等挑战 ...
深度神经网络(DNN)在各种多模式学习问题上表现出了出色的表现。但是,通常需要巨大的努力来通过手动设计单峰功能并设计多模式特征融合策略来适应单个多模式任务。本文提出了双重模式神经体系结构搜索(BM-NAS)框架,该框架使多模式融合模型的体系结构可以通过双光线搜索方案进行全面搜索 ...
我们提出网格节,这是一个简单而有效的框架,旨在零击3D语义分割。该模型成功地将2D分割模型的强大功能扩展到了3D网格,从而在不同的网格和段描述中提供了准确的3D分割。具体而言,我们的模型利用段的任何模型(SAM)模型从3D形状呈现的图像中分割目标区域 ...
事件摄像机的每个像素强度变化,并产生具有高动态范围和运动模糊较小的异步事件流,显示出比常规摄像机的优势。基于培训事件的模型的障碍是缺乏大型定性标记数据。先前的工作学习端任务主要依赖于从活动像素传感器(APS)帧中获得的标记或伪标记的数据集;但是,这样的数据集的质量远非基于规范图像与这些质量匹配 ...
随着业务方案的扩展,真正的推荐系统在处理多任务学习框架中不断出现的新任务方面面临着挑战。在本文中,我们试图提高处理新任务时多任务建议的概括能力。我们发现联合培训将提高新任务的性能,但在大多数多任务学习方法中始终对现有任务产生负面影响 ...
模仿学习(IL)具有在体现药物中实现敏捷运动的巨大希望。但是,许多现有的运动基准主要集中在简化的玩具任务上,通常无法捕获现实世界情景的复杂性并将研究转向不现实的领域。为了推进IL的运动研究,我们提出了一种新的基准测试,旨在促进IL算法的严格评估和比较 ...
图形神经网络将常规神经网络推广到图形结构化数据,并因其令人印象深刻的表示能力而受到广泛关注。尽管取得了显着的成就,但欧几里得模型在与图相关的学习中的表现仍然受到欧几里得几何形状的表示能力的限制和限制,尤其是对于具有高度非欧盟潜在解剖学的数据集。最近,由于其指数生长特性,双曲线空间在使用类似树状的结构和幂律分布的图形数据中越来越受欢迎 ...
近年来,由于其出色的性能和概括能力,大型语言模型(LLMS)引起了研究社区的极大关注。在本文中,我们引入了一种新颖的方法,用于将融合LLM的语音识别模型进行情境化。我们的方法将语音识别视为基于验证的LLM的混合模式建模任务 ...