腿部机器人非常适合驾驶无法使用轮式机器人的地形,使其非常适合在搜索和救援或太空探索中应用。但是,当前的控制方法通常很难跨越各种非结构化环境。本文引入了一个新颖的框架,用于通过将多型蒸馏与增强学习(RL)微调相结合以实现强大的概括性,以实现腿部机器人的敏捷运动 ...
尽管基于学习的立体声匹配算法取得了显着进展,但仍未解决一个关键挑战。当前最新的立体声模型主要基于昂贵的3D卷积,立方计算复杂性和高内存消耗使得在现实世界应用中部署它非常昂贵。在本文中,我们旨在完全替换常用的3D卷积,以实现快速推理速度,同时保持可比的精度 ...
经过明确方法训练的经典神经ODE在稳定性上本质上受到限制,使其在图形学习和科学机器学习中常见的僵化学习问题效率和稳健性。我们提出了一种半图像神经驱动方法,该方法利用了基本动力学的可划分结构。我们的技术导致一个隐式神经网络,由于稳定性增强和在时间整合过程中的有效线性解决方案,具有与现有方法相比具有显着计算优势的隐性神经网络 ...
域的概括(DG)方法旨在通过仅使用来自源域的训练数据来实现对看不见的目标域的通用性。尽管已经提出了多种DG方法,但最近的一项研究表明,在公平的评估方案(称为域名)下,简单的经验风险最小化(ERM)方法可与以前的方法相当甚至优于以前的方法。不幸的是,只需在复杂的,非凸损耗函数上解决ERM,可以通过寻求尖锐的最小值轻松地导致次优的概括性 ...
我们提出了一个新的合奏框架,用于提高解决压缩感应问题的过度参数化的展开网络的性能。我们将最先进的过度参数化的展开网络与持续技术结合在一起,以使启动至关重要的大量上述网络架构。我们创造了由此产生的持续网络C-DEC。此外,对于训练和评估C-DEC,我们结合了符合线性和二次行为的对数损失函数 ...
大语言模型(LLM)的指数增长为多模式AGI系统开辟了许多可能性。但是,视觉和视觉基础模型的进展也是多模式AGI的关键要素,并未与LLM保持同步。在这项工作中,我们设计了一个大规模的视觉基础基础模型(InternVL),该模型将视觉基础模型扩展到60亿个参数,并使用来自各种来源的Web尺度映像 - 文本数据逐步将其与LLM保持一致 ...
定量市场的特征是迅速的动态和丰富的不确定性,使追求利润驱动的股票交易行动固有地具有挑战性。在这种情况下,采用以奖励为中心的最佳控制机制运作的增强学习(RL)已成为对复杂的财务决策制定难题的潜在有效解决方案。本文深入研究了两种已建立的财务交易策略的融合,即恒定比例投资组合保险(CPPI)和时间不变的投资组合保护(TIPP),以及多代理的深层确定性政策梯度(MADDPG)框架 ...
本文介绍了一种新方法,以PDF格式从技术图中提取和分析矢量数据。我们的方法涉及将PDF文件转换为SVG格式并创建富特征的图表表示,该图表使用几何信息捕获向量实体之间的关系。然后,我们应用具有分层标签定义的图形注意 Transformer ,以实现准确的线路级分割 ...