多通道成像(MCI)包含一系列挑战,用于编码传统图像中不存在的有用特征表示。例如,来自两个不同卫星的图像都可能包含RGB通道,但是对于每个成像源,其余的通道可能不同。因此,MCI模型必须在测试时支持各种通道配置 ...
Rerankers通过完善初始检索文档的排名,在多模式检索仪(RAG)中发挥着关键作用。 Rerankers通常是使用硬采矿进行培训的,其目标是为每个排名较高但实际上无关紧要的查询选择页面。但是,此选择过程通常是被动的,并且仅限于猎犬在可用语料库中可以找到的,从而导致了几种固有的局限性 ...
图形嵌入提供了图中节点的连续矢量表示,这些节点广泛适用于社区检测,建议和各种科学领域。但是,现有的图形嵌入系统要么由于RAM和多个GPU的高成本而面临可伸缩性挑战,要么以I/O效率为代价依靠磁盘存储。在本文中,我们提出了Legend,这是一种用于嵌入图形的轻质异质系统,该系统系统地重新定义了CPU,GPU和NVME SSD资源的数据管理 ...
固态驱动器(SSD)固件管理复杂的内部状态,包括闪存维护。由于非确定性I/O操作,传统的测试方法难以快速实现需要大量I/O积累的固件代码区域的覆盖范围。为了应对这一挑战,我们提出了一种州数据感知的模糊方法,该方法利用SSD固件的内部状态指导在非确定I/O条件下的输入生成并加速覆盖范围发现 ...
培训对话提问(QA)系统需要大量的内域数据,这在实践中通常很少。解决这一挑战的一个常见解决方案是生成合成数据。传统方法通常遵循自上而下的方法,其中大语言模型(LLM)从广义提示中生成多转对话 ...
我们提出了一个可微分模型,使用我们称为边界注意的机制来推断显式边界,包括曲线、拐角和交汇处。边界注意力是一种边界感知局部注意力操作,当密集且重复地应用时,它会逐步细化变量字段,这些变量指定图像中每个重叠补丁中局部边界结构的非光栅化描述。它以自下而上的方式运行,类似于亚像素边缘定位和边缘链接的经典方法,但具有局部边界结构的高维描述、学习而不是设计的空间一致性概念以及端到端可微分的操作序列 ...
知识蒸馏(KD)是通过利用教师模型的知识来训练紧凑,特定于任务模型的广泛使用的框架。但是,其在主动学习中的应用(AL)旨在通过迭代样本选择最大程度地降低注释成本,但仍未得到充实。这一差距源于KD通常假设访问足够标记的数据的事实,而AL在数据筛选的情况下运行,而这些方案通常无法获得特定于任务的教师模型 ...
随着高级智能从模块化组件与低级智能的结合出现,许多作品结合了集体智能的大型语言模型(LLMS)。通过在LLM之间建立通信来实现此类组合。尽管当前的系统主要通过自然语言促进这种交流,但本文提出了一种新颖的LLM之间直接密集矢量通信的范式 ...