由大语言模型(LLMS)提供动力的生成AI(Genai)服务越来越多地提供实时交互,但是现有的5G多访问边缘计算(MEC)体系结构通常将通信和计算视为单独的域,从而限制了它们满足严格的延迟需求的能力。为了应对这一挑战,我们引入了一个集成的通信和计算框架(ICC)框架,其中计算功能可直接驻留在无线电访问网络(RAN)节点中,并共同管理带宽和计算资源。我们的队列理论分析表明,ICC的表现优于5G ME ...
0 0 0 2025/06/12 arXiv:2504.16529v1 rogers
大型人工智能模型(LAM)具有类似人类的能力来解决各种各样的现实问题,体现了各种领域和模式中专家的潜力。通过利用地理分散的边缘设备的通信和计算功能,Edge Lam成为一种使技术促进6G中各种实时智能服务的能力。与主要使用小型模型支持单个任务的传统边缘人工智能(AI)不同,Edge Lam的特征是需要分解和分布式大型模型的部署,以及支持高度概括和多样化的任务的能力 ...
0 0 0 2025/06/12 arXiv:2505.00321v1 rogers
大型语言模型(LLMS)在固定上下文窗口中面临着至关重要的挑战,并且内存管理不足,导致长期记忆能力的严重短缺和与AI代理的互动体验中的个性化有限。为了克服这一挑战,我们创新提出了一个内存操作系统,即 ...
0 0 0 2025/06/12 arXiv:2506.06326v1 hwrabbit
大型推理模型(LRMS)也具有自我校正的能力,即使他们在推理道路上犯错误。但是,我们的研究表明,当推理过程以短暂但糟糕的开端开始时,模型很难恢复。我们将此现象称为“前缀优势陷阱” ...
0 0 0 2025/06/12 arXiv:2505.07787v1 chrisxiong
相机和人类的运动控件已被广泛研究以进行视频生成,但是现有方法通常会分别解决它们,遭受有限的数据,这两个方面都具有高质量的注释。为了克服这一点,我们提出了Uni3C,这是一个统一的3D增强框架,用于在视频生成中精确控制相机和人类运动。 UNI3C包括两个关键贡献 ...
0 0 0 2025/06/12 arXiv:2504.14899v1 小小卡拉米
我们如何在广泛的自我驾驶行为下可靠地模拟未来的驾驶场景?最近的驾驶世界模型仅根据现实世界中的驱动数据而开发,主要由安全的专家轨迹组成,难以遵循危险或非专家行为,这些行为在此类数据中很少见。此限制将其适用性限制在政策评估等任务中。在这项工作中,我们通过通过从驾驶模拟器中收集的各种非专家数据来丰富现实世界中的人类示范来应对这一挑战(e ...
0 0 0 2025/06/12 arXiv:2506.09981v1 xubiao
自动放射学报告生成(RRG)是减轻放射科医生大量工作量的重要主题。现有的RRG方法依赖于基于不同架构或其他知识注入的监督回归,而生成的报告可能与放射科医生的偏好不符。特别是,由于放射科医生的偏好本质上是异质和多维的偏好 ...
0 0 0 2025/06/12 arXiv:2412.08901v2 尼斯湖
最近,旨在自动生成一份较长且连贯的描述性段落的医学报告产生,并获得了越来越多的研究兴趣。与一般图像字幕任务不同,医疗报告的生成对于数据驱动的神经模型更具挑战性。这主要是由于1)严重的数据偏见:正常的视觉区域在异常视觉区域上占主导地位,以及2)很长的序列 ...
0 0 0 2025/06/12 arXiv:2203.10095v1 尼斯湖

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)