在边缘设备上部署大型语言模型(LLM)对于增强设备上的智能变得越来越重要。权重化对于减少LLM在设备上的内存占用至关重要。然而,低位LLM需要在推理过程中进行低位精度权重和前置激活的混合精度矩阵乘法 (mpGEMM) ... ...
我们回顾了集群财务时间序列的艺术状况及其与其他互动网络一起研究的研究。这篇评论的目的是在一个地方聚集来自不同领域的相关材料,例如 ...
生成掌握姿势是任何机器人对象操纵任务的关键组件。在这项工作中,我们使用差异自动编码器来对一组grasps进行抽样,并使用GRASP评估器模型来评估和完善采样的grasps。 Grasp Sampler和Grasp改进网络都将深度摄像头视为输入观察到的3D点云 ...
尽管通过零摄像图识别的对比语言图像预处理(剪辑)取得了显着的结果,但已经有限的努力探索了其零拍视频识别的潜力。本文介绍了开放式VCLIP ++,这是一个简单而有效的框架,可将剪辑适应强大的零击视频分类器,能够在测试过程中识别新颖的动作和事件。 Open-VCLIP ++最小化修饰剪辑以捕获视频中的时空关系,从而在努力进行概括的同时创建了专门的视频分类器 ...
错误的标签问题和长尾关系是由遥远的指定遥远的监督造成的两个主要挑战。最近的著作通过多个实体学习通过选择性关注来减轻错误的标签,但即使引入了关系的层次结构以共享知识,也无法很好地处理长尾关系。在这项工作中,我们提出了一个新颖的神经网络,协作了与关系的关注(CORA),以处理错误的标签和长尾关系 ...
大型语言模型(llm)的最新进展催生了能够执行复杂任务的智能代理。本文介绍了一种新颖的基于llm的多模式代理框架,旨在操作智能手机应用程序。我们的框架使代理能够通过简化的动作空间来操作智能手机应用程序,模仿类人交互,例如点击和滑动... ...
本文着重于在模拟中使用平行的下颌抓手学习6-DOF抓握的问题。我们基于以下假设:3D几何学知识是相互作用的核心,我们提出了几何感知表示的概念。我们的关键思想是通过3D几何预测来限制和正规化掌握交互学习 ...
预测时间序列的问题通常由经常性,基于 Transformer 和最近提出的基于MAMBA的体系结构解决。但是,现有体系结构通常以单个时间尺度处理其输入,这对于许多任务而言,这可能是在多个时间尺度上变化的许多任务。在本文中,我们介绍了一种名为Multi cale Mamba(MS-Mamba)的新颖建筑,以解决这一差距 ...