最近的自然语言处理技术一直以令人难以置信的速度刷新最新的性能。因此,培训巨大的语言模型是行业和学院的必要需求。但是,巨大的语言模型对硬件和软件都构成了挑战 ...
对特定于任务数据的微调大语言模型(LLM)对于其有效部署至关重要。随着数据集尺寸的增长,有效选择用于培训的最佳子集对于平衡性能和计算成本至关重要。传统的数据选择方法通常需要在目标数据集上进行微调计分模型,该数据集是耗时且资源密集的,或者依靠无法完全利用该模型的预测能力的启发式方法 ...
大型语言模型(LLMS)在广泛的应用中表现出了出色的性能,例如医疗问题,数学科学和代码生成 ...
具有数千个类别的多标签分类问题很难仅通过上下文学习来解决,lm)可能缺乏关于精确类别或如何分配它们的先验知识,并且通常不可行一个提示。我们提出了一个通用程序$ \ texttt {celes-- retriev--rank} $,它定义了lm和检索器之间的多步骤交互,以有效地解决此类问题。我们使用$ \ texttt {dspy} $编程模型来实现该程序 ...
尽管近年来机器人抓握的进展和概括性取得了巨大的进步和概括,但现有方法尚未扩展和推广以任务为导向的握把。这在很大程度上是由于数据集的规模在研究的对象数量和所研究的任务方面。我们使用TaskGrasp数据集来解决这些问题,该数据集在对象和任务方面都更加多样化,并且比以前的数据集更大 ...
在现实世界的任务中实现人类水平的速度和性能是机器人研究界的北极星。这项工作朝着这一目标迈出了一步,并提出了第一个在竞技乒乓球比赛中达到业余人类水平表现的学习型机器人代理。乒乓球是一项对体力要求很高的运动,需要人类运动员经过多年的训练才能达到高水平的熟练程度 ...
在资源受限设备上部署深层卷积神经网络(CNN),由于其高度计算需求和刚性,静态体系结构提出了重大挑战。为了克服这些局限性,本文探讨了使CNN能够根据可用硬件资源动态调整其计算复杂性的方法。我们介绍了能够在运行时扩展其容量的自适应CNN体系结构,从而有效地平衡了性能和资源利用率 ...
混沌系统对小错误本质上是敏感的,这具有挑战性的努力,以构建现实世界动态系统(例如流体流或神经元活动)的预测数据驱动模型。先前的努力包括在单个时间序列上单独培训的专业模型,或者在庞大的时间序列数据库中培训的基础模型很少有基本的动态结构。在动力学系统理论的启发下,我们提出了熊猫,对非线性动力学进行了修补 ...