在智能运输中,开发有效的路径表示已变得越来越重要。尽管预先训练的路径表示模型显示出改善的性能,但它们主要集中在单个模态数据的拓扑结构上,即 ...
SQL(NL2SQL)的自然语言通过将自然语言查询转换为结构化的SQL语句,从而可以与数据库进行直观的交互。尽管最近在增强数据库应用程序中的人类计算机互动方面取得了进步,但重大挑战仍然存在,尤其是在涉及多桌子连接和嵌套查询的复杂场景中的推理性能方面。当前的方法论主要利用监督的微调(SFT)来训练NL2SQL模型,这可能会限制新环境中的适应性和可解释性(e ...
随着临界领域的机器学习模型越来越多地应对多模式数据,他们面临着处理各种方式的双重挑战,通常由于缺失的元素以及收集的样本的时间不规则性和稀疏性而经常不完整。在克服高质量培训样本的稀缺时,成功利用这些复杂数据是改善这些模型的预测性能的关键。我们介绍了``fusemoe'',这是一种与创新的门控函数合并的专家框架 ...
随着大型语言模型(LLM)已变得越来越多地计算和记忆密集型,参数有效的微调(PEFT)方法现在是微调LLM的常见策略。流行的PEFT方法是低级适配器(LORA),它为选定的层增添了可训练的低级“适配器”。每个适配器由低级矩阵乘积组成,乘以等级依赖性因子 ...
尽管使用更快、更深的卷积神经网络在单图像超分辨率的准确性和速度方面取得了突破,但一个核心问题在很大程度上仍未解决:当我们以大的放大因子进行超分辨率时,如何恢复更精细的纹理细节?基于优化的超分辨率方法的行为主要由目标函数的选择驱动。最近的工作主要集中在最小化均方重建误差。由此产生的估计具有较高的峰值信噪比,但它们通常缺乏高频细节,并且在感知上不令人满意,因为它们无法匹配更高分辨率下预期的保真度... ...
强化学习(RL)在顺序决策任务中显示出令人印象深刻的结果。同时,出现了大型语言模型(LLM)和视觉模型(VLM),在多模式理解和推理方面表现出了令人印象深刻的能力。这些进步导致了将LLM和VLMS整合到RL的研究激增 ...
当前基于学习的主题自定义方法主要依赖于U-NET体系结构,具有有限的概括能力和图像质量受损。同时,基于优化的方法需要特定于主题的微调,这不可避免地会降低文本可控性。为了应对这些挑战,我们提出了InstantCharacter,这是基础扩散 Transformer 建立的角色自定义的可扩展框架 ...
扩散生成模型在图像和视频生成等视觉域中表现出了很大的成功。他们最近还成为机器人技术中的一种有前途的方法,尤其是在机器人操作中。扩散模型利用了一个概率框架,他们以对高维输入和输出空间进行建模多模式分布以及鲁棒性的能力而脱颖而出 ...