站立控制对于人形机器人至关重要,具有整合到当前的运动和机能处理系统(例如秋季恢复)中的潜力。现有的方法要么仅限于忽略硬件约束的模拟,要么依赖于预定义的地面特异性运动轨迹,从而无法在现实世界场景中跨越姿势。为了弥合这一差距,我们提出了主机(人形站立控制),这是一个增强学习框架,从头开始学习站立控制,从而使SIM到实现的SIM转移到各种姿势中 ...
近年来,状态空间模型(SSM)已成为序列建模任务的有效工具。这些模型使用一组基础功能近似连续系统并将其离散为处理输入数据,从而非常适合建模以从连续系统的特定频率收集的时间序列数据。尽管具有潜力,但SSM在时间序列预测中的应用仍未得到充满意,大多数现有模型都将SSM视为用于捕获时间或频道依赖性的黑匣子 ...
当前的分层增强学习(HRL)算法在长期序列决策任务中出色,但仍然面临两个挑战:延迟效果和虚假相关性。为了解决它们,我们提出了一种称为D3HRL的因果HRL方法。首先,D3HRL模型延迟了效果,因为跨不同时间跨度的因果关系,并采用分布的因果发现来学习这些关系 ...
我们研究深度强化学习((深rl)是否能够为低成本、微型人形机器人合成复杂且安全的运动技能,并在动态环境中将其组合成复杂的行为策略。我们使用深度强化学习来训练具有,并在动态环境中将其组合成复杂的行为策略。我们使用深度强化学习来训练具有20个驱动关节的人形机器人来玩简化的一对一(1v1)足球比赛。由此产生的智能体表现出强大而动态的运动技能,例如快速跌倒恢复、行走、转身、踢腿等;并以平稳、稳定、高效的方 ...
在这项研究中,我们提出了一种新型的深层时空点过程模型,深核混合点过程(DKMPP),其中包含了多模式协变量信息。 DKMPP是深层混合点过程(DMPP)的增强版本,它使用更灵活的深内核来模拟事件和协变量数据之间的复杂关系,从而提高了模型的表现力。为了解决由于不可融合的深内核而引起的DKMPP的棘手训练程序,我们基于得分匹配,利用了一种无积分方法,并通过采用可扩展的DeNoSising分数匹配方法来 ...
驾驶场景中的驾驶员注意力识别是交通现场感知技术的流行方向。它旨在了解人类驾驶员的注意,以关注驾驶场景中的特定目标/对象。但是,流量场景不仅包含大量的视觉信息,还包含与驾驶任务相关的语义信息 ...
机器上的学习通过删除在机器学习模型中编码的私人或敏感信息,从而使个人具有“被遗忘的权利”的能力。但是,仍然不确定MU是否可以有效地应用于多模式大语模型(MLLM),尤其是在忘记概念泄漏的视觉数据的情况下。为了克服挑战,我们提出了一种有效的方法,即单个图像(SIU),以通过几个步骤对单个相关图像进行微调来识别概念的视觉识别 ...
我们介绍了条件感知的自我监督学习表示(CA-SSLR),这是一种通才调节模型,广泛地适用于各种语音处理任务。与为下游模型优化的标准微调方法相比,CA-SSLR集成了早期层中的语言和说话者嵌入,使SSL模型了解当前的语言和说话者的环境。这种方法在保留基本SSLR的完整性的同时降低了对输入音频功能的依赖 ...