量子神经网络(QNN)是近期嘈杂的中间尺度量子(NISQ)设备可以在经典资源上找到有利的应用程序的有希望的方向之一。复发性神经网络是顺序学习的最基本网络,但是到目前为止,仍然缺乏量子复发性神经网络(QRNN)的规范模型,这无疑限制了量子深度学习领域的研究。在目前的工作中,我们提出了一种新型的QRNN,这将是一个很好的候选者作为规范QRNN模型,在其中,量子循环块(QRB)以硬件有效的方式构建,而Q ...
扩散模型的最新进展导致了音频驱动的唇同步的重大进展。但是,现有方法通常依赖于受约束的视听比对先验或中间表示的多阶段学习来迫使唇部运动合成。这导致复杂的训练管道和有限的运动自然性 ...
我们提出了一个名为Gramian角场(QGAF)的时间序列预测方法。这种方法将量子计算技术的优势与深度学习相结合,旨在提高时间序列分类和预测的精度。我们通过设计特定的量子电路,成功地将股票返回时间序列数据转换为适合卷积神经网络(CNN)训练的二维图像 ...
多模型模型的一项基本任务是将引用的图像区域转换为人类首选语言描述。但是,现有方法忽略了不同任务的分辨率适应性需求,这会阻碍他们找出精确的语言描述。在这项研究中,我们提出了一种dynrefer方法,以通过模仿人类视觉认知的分辨率适应性来追求高准确区域级别 ...
传统上,离线数据集已用于评估面向任务的对话(TOD)模型。这些数据集缺乏上下文意识,使它们成为对话系统的次优基准。相反,具有上下文感知的用户代理可以模拟人类对话的可变性和不可预测性,从而使它们成为评估者的替代方案 ...
以对比性语言图像预训练(剪辑)代表的视觉语言基础模型已获得越来越多的关注,以共同理解视力和文本任务。但是,现有方法主要集中在培训模型上,以将全局图像表示与文本描述匹配,从而忽略了本地区域和相应的文本 Token 之间的关键对齐方式。本文以多粒性比对扩展了夹子 ...
对话产品搜索(CPS)的目的是开发一个基于聊天的智能购物助理,可以直接与客户互动以了解购物意图,提出澄清问题并找到相关产品。但是,培训此类助手的限制主要是由于缺乏可靠和大规模的数据集而受到阻碍。先前的人类注销的CPS数据集的规模极小,并且与现实世界中的产品搜索系统缺乏集成 ...
大型语言模型(LLMS)已在各种任务中表现出显着的上下文推理功能,尤其是在非结构化输入(例如语言或图像)的情况下。但是,由于缺乏对非欧几里得结构的了解,LLM努力处理结构化数据,例如图形。结果,在没有其他微调的情况下,它们的性能显着落后于图形学习任务中的图神经网络(GNN) ...