使用大型语言模型(LLM)是昂贵的,尤其是对于托管许多型号的提供商而言,使成本降低至关重要。服务多个LLM的独特工作量模式(即 ...
量子机械性能的预测在历史上受到准确性和速度之间的权衡而困扰。机器学习潜力以前在该领域表现出了巨大的成功,在保持与经典力场相当的计算效率的同时达到了越来越高的准确性。在这项工作中,我们提出了Torchmd-net,这是一种新型的型号 Transformer (ET)体系结构,在准确性和计算效率方面都超过了MD17,ANI-1的最先进以及许多QM9目标 ...
由多模式大型语言模型(MLLM)驱动的图形用户界面(GUI)代理已经成为一种有希望的范式,可实现与数字系统的智能互动。本文提供了一个结构化的摘要,内容涉及GUI代理的最新进展,重点是增强学习(RL)增强的体系结构。我们首先将GUI代理任务形式化为马尔可夫决策过程,并讨论典型的执行环境和评估指标 ...
Vision语言动作(VLA)模型标志着人工智能的变革性进步,旨在在单个计算框架内统一感知,自然语言理解和体现的行动。这项基本综述介绍了视觉动作模型的最新进步的全面综合,该模型是在构建了这个快速发展的领域景观的五个主题支柱上系统地组织的。我们首先建立VLA系统的概念基础,从而将它们从跨模式学习体系结构到通才代理人的演变,这些通才代理紧密整合了视觉模型(VLM),行动计划者和层次结构控制器 ...
大型语言模型(LLM)的快速发展促使人们需要更有效的服务策略。在这种情况下,效率是指符合其服务级别目标(SLO)的请求的比例,特别是为了首先执行 Token (TTFT)和 Token (TBT)之间的时间。但是,现有的系统通常以另一个指标为基础,将一个指标优先考虑 ...
在深度学习的最新进展的帮助下,无模型的强化学习(RL)方法已成功完成了越来越多的任务。但是,它们倾向于遭受较高的样本复杂性,这阻碍了它们在现实世界中的使用。另外,基于模型的增强学习有望降低样本的复杂性,但是往往需要仔细调整,迄今为止,主要在简单模型足以学习的限制性领域中取得了成功 ...
学习图像压缩的最新模型基于自动编码器,从像素到量化的潜在表示大致学习可逆映射。这些与熵模型相结合,该模型的先验是可与标准算术编码算法一起使用的潜在表示,以产生压缩的bitstream。最近,已经引入了分层熵模型,是一种比简单分解的先验相比,在未完全分解的先验中利用更多的结构,在维持端到端优化的同时改善压缩性能 ...
作为高级人工智能的分支,对话系统正在繁荣。多转响应选择是对话系统中的一般研究问题。在背景信息和预训练的语言模型的协助下,最新方法在此问题上的性能取得了令人印象深刻的改进 ...