图在表示和分析现实应用程序(例如引文网络、社交网络和生物数据)中的复杂关系方面发挥着重要作用。最近,在各个领域取得巨大成功的大型语言模型(LLM)也被用于图相关任务,以超越传统的基于图神经网络(GNN)的方法并产生最先进的性能。在本次调查中,我们首先对将 LLM 与图表相结合的现有方法进行了全面的回顾和分析 ...
0 0 0 2024/04/25 arXiv:2311.12399v4 大西瓜
本文研究了一种用于海量通信的端到端视频语义通信系统。在所考虑的系统中,发送器必须连续将视频发送到接收器,以促进沉浸式应用(例如交互式视频会议)中的角色重建。然而,传输具有大量数据的原始视频信息对有限的无线资源提出了挑战 ...
0 0 0 2024/04/25 arXiv:2402.01330v1 HaoLiu0209
大规模推荐系统的特点是依赖高基数、异构特征以及每天需要处理数百亿个用户操作。尽管经过了具有数千个特征的海量数据的训练,但业界大多数深度学习推荐模型(DLRM)都无法随着计算而扩展。
受到 Transformers 在语言和视觉领域取得的成功的启发,我们重新审视推荐系统中的基本设计选择 ...
0 0 0 2024/04/25 arXiv:2402.17152v2 difanyi
深度生成模型开启了人类创造力的另一个深刻领域。通过捕获和概括数据中的模式,我们已经进入了全方位人工智能促进通用创造力(AIGC)的时代。值得注意的是,扩散模型被认为是最重要的生成模型之一,它将人类的观念具体化为跨不同领域的有形实例,包括图像、文本、语音、生物学和医疗保健 ...
0 0 0 2024/04/25 arXiv:2209.02646v10 云汐瑶
大型视觉语言模型 (LVLM) 的最新进展使得能够在语言模型中处理多模式输入,但需要大量的计算资源进行部署,尤其是在边缘设备中。本研究旨在通过采用高质量的训练数据来缩小传统规模的 LVLM 和资源友好型精简版之间的性能差距。为此,我们利用 GPT-4V 生成详细说明、复杂推理指令和图像详细答案的能力来创建合成数据集 ...
0 0 0 2024/04/25 arXiv:2402.11684v1 bage
Transformer 和多层感知器 (MLP) 模型的最新进展为计算机视觉任务提供了新的网络架构设计。尽管这些模型被证明在图像识别等许多视觉任务中是有效的,但将它们适应低级视觉仍然存在挑战。支持高分辨率图像的不灵活性和局部注意力的限制可能是主要瓶颈 ...
0 0 0 2024/04/25 arXiv:2201.02973v2 bnexx
我们介绍 Plenoxels(全光体素),一种用于照片级真实感视图合成的系统。 Plenoxels 将场景表示为具有球谐函数的稀疏 3D 网格。这种表示可以通过梯度方法和正则化从校准图像中进行优化,而无需任何神经组件 ...
0 0 0 2024/04/25 arXiv:2112.05131v1 sycamore
Transformer 在自然语言处理、计算机视觉、音频处理等许多人工智能领域取得了巨大成功。因此,自然引起学术界和工业界研究人员的广泛兴趣。到目前为止,Transformer 的变体种类繁多(a. ...
0 0 0 2024/04/25 arXiv:2106.04554v2 yqstar

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)