本文探讨了思想链(COT)在大语言模型(LLMS)推理中的作用。尽管它有可能提高任务绩效,但我们的分析揭示了不正确的COTS后正确答案的令人惊讶的频率,反之亦然。我们采用因果分析来评估LLMS中COTS/指令和答案之间的因果关系,从而发现了LLMS近似的结构性因果模型(SCM) ...
在顺序推荐系统中,最近使用扩散模型引入了数据增强和对比度学习技术,以实现强大的表示。但是,大多数现有方法都使用随机增强,这可能会损害原始序列的上下文信息。因此,我们提出了相似性引导的扩散,以进行对比顺序推荐 ...
由于硬件和软件限制,以前的动画面孔很难有效地表达情绪。在硬件方面,早期的方法要么使用刚性驱动的机制,这些机制提供了精确的控制,但很难在受约束的空间内设计,要么在肌腱驱动的机制内设计,这是更高效率但更具挑战性控制的机制。相比之下,我们提出了一种结合两全其美的混合动力驱动方法 ...
主要的LLM专注于高资源语言,同时留下低资源语言,尤其是在东南亚(SEA)的语言,人数不足。此外,这些模型是通用的,并且对电子商务领域的关注有限。为了克服这些限制,我们引入了Compass-V2,这是专门为东南亚语言和电子商务应用设计的轻量级混合物(MOE)模型 ...
合成孔径雷达(SAR)图像中的飞机检测是SAR自动目标识别(SAR ATR)区域的一项具有挑战性的任务,这是由于飞机的外观极为离散的外观,明显的内部内变化,小尺寸和严重的背景干扰。在本文中,提出了一个单发探测器,即注意特征的细化和对齐网络(AFRAN)提议以竞争力和速度的速度和速度检测SAR图像中的飞机。具体而言,在我们的方法中精心设计了三个重要组成部分,包括注意特征融合模块(AFFM),可变形的 ...
尽管针对软件工程的语言模型(LMS)最近取得了进展,但收集培训数据仍然是一个重要的痛苦点。现有数据集很小,最多有11个或更少的GitHub存储库的培训实例。策划此类数据集的程序通常很复杂,需要数百小时的人工劳动;伴侣执行环境还占用了几种存储的数量,严重限制了它们的可扩展性和可用性 ...
通过外部知识的结合,检索增强的生成(RAG)已成为一种有效的方法来增强大语言模型(LLMS)的生成能力的有效方法。但是,由于检索和发电组件之间的复杂相互作用,对抹布系统的评估仍然是一个挑战。这种局限性导致了基准的稀缺性,这些基准有助于详细的,特定于组成的评估 ...
我们提出了Dino-World,这是一个强大的通才视频世界模型,训练有素,可以预测Dinov2潜在空间的未来框架。通过利用预先训练的图像编码器并在大规模未进行的视频数据集上训练未来的预测器,Dino-World了解了不同场景的时间动态,从驾驶和室内场景到模拟环境。我们表明,Dino-World在各种视频预测基准中都胜过以前的模型,例如 ...