如何最好地开发时间序列预测的基础模型仍然是一个重要的开放问题。 Token 化是这项工作中的至关重要的考虑:什么是实现顺序输入的有效离散词汇?为了解决这个问题,我们开发了Wavetoken,这是一种基于小波的 Token ,它允许模型直接在时间定位的频率的空间中学习复杂的表示。我们的方法首先缩放并分解输入时间序列,然后阈值并量化小波系数,最后将自回归模型预测到预测范围的自动回归模型 ...
深层神经网络通过学习从低分辨率(LR)到高分辨率(HR)图像的映射,在自然图像的超分辨率(SR)方面表现出了高度竞争性的性能。然而,由于数据的高频谱维度和可用训练样本的稀缺性,高光谱超分辨率仍然是一个不良问题。此外,现有方法通常依赖于具有大量参数的大型模型,或者需要与Panchromation或RGB图像进行融合,在实际情况下,这两者通常都是不切实际的 ...
常规的时间序列分类(TSC)方法通常是黑匣子,它们掩盖了对其决策过程的固有解释。在这项工作中,我们利用多个实例学习(MIL)来克服此问题,并提出了一个名为Millet:用于本地解释时间序列分类的新框架:多重实例学习。我们将小米应用于现有的深度学习TSC模型,并展示它们如何固有地解释,而不会妥协(在某些情况下,甚至改善)预测性能 ...
我们证明,配备基本编码工具的LLM编码代理可以自主编辑自身,从而提高其在基准任务上的性能。我们发现,在经过验证的SWE基准的随机子集中,绩效从17%提高到53%,并在livecodebench上获得了额外的性能增长,以及合成生成的代理基准。我们的工作代表了代理系统的自动化和开放式设计的进步,并为那些寻求在工具使用和其他代理任务上培训LLM的人提供了参考代理框架 ...
大型视觉模型中的最新进展正在加速使用类似人类视觉感知能力的图形用户界面(GUI)代理的开发,以提高数字设备上的生产力。与基于GUI元数据的方法相比,该方法依赖于平台且容易受到实施变化,基于视觉的方法可提供更广泛的适用性。在这个基于视觉的范式中,将用户指导映射到给定屏幕截图上相应元素的位置的GUI指令接地仍然是一个关键挑战,尤其是由于公共培训数据集有限和资源密集型手动指令数据注释 ...
由于不断发展的基础架构,异质硬件和波动的工作负载,自动化云配置和部署仍然是一个关键的挑战。现有的解决方案缺乏适应性,需要大量的手动调整,从而导致效率低下和配置错误。我们介绍了LADS,这是第一个以LLM驱动的框架,旨在通过确保自动化云管理的鲁棒性,适应性和效率来应对这些挑战 ...
从分类发行版中取样的众所周知的Gumbel-Max技巧可以扩展到无需更换的$ k $元素。我们展示了如何在序列上的分解分布上隐式地应用此“ gumbel-top- $ k $”技巧,从而可以使用随机梁搜索绘制精确的样品而无需替换。即使对于指数性的大域,模型评估的数量也仅在$ K $和最大采样序列长度中增长 ...
我们认为,基于扩散的生成模型的理论和实践目前是不必要的,并试图通过呈现一个明确分开具体设计选择的设计空间来纠正这种情况。这使我们能够确定对采样过程和培训过程的几个更改,以及分数网络的预处理。我们的改进共同产生了1个新的最先进的FID ...