一译 —— 文档和论文翻译、对照阅读、讨论和社区

Enhancing Feature Diversity Boosts Channel-Adaptive Vision Transformers

多通道成像（MCI）包含一系列挑战，用于编码传统图像中不存在的有用特征表示。例如，来自两个不同卫星的图像都可能包含RGB通道，但是对于每个成像源，其余的通道可能不同。因此，MCI模型必须在测试时支持各种通道配置 ...

0 0 0 2025/06/04 arXiv:2405.16419v2 maxwill

DocReRank: Single-Page Hard Negative Query Generation for Training Multi-Modal RAG Rerankers

Rerankers通过完善初始检索文档的排名，在多模式检索仪（RAG）中发挥着关键作用。 Rerankers通常是使用硬采矿进行培训的，其目标是为每个排名较高但实际上无关紧要的查询选择页面。但是，此选择过程通常是被动的，并且仅限于猎犬在可用语料库中可以找到的，从而导致了几种固有的局限性 ...

0 0 0 2025/06/04 arXiv:2505.22584v1 arthur

Efficient Graph Embedding at Scale: Optimizing CPU-GPU-SSD Integration

图形嵌入提供了图中节点的连续矢量表示，这些节点广泛适用于社区检测，建议和各种科学领域。但是，现有的图形嵌入系统要么由于RAM和多个GPU的高成本而面临可伸缩性挑战，要么以I/O效率为代价依靠磁盘存储。在本文中，我们提出了Legend，这是一种用于嵌入图形的轻质异质系统，该系统系统地重新定义了CPU，GPU和NVME SSD资源的数据管理 ...

0 0 0 2025/06/04 arXiv:2505.09258v2 mike_zhang

Testing SSD Firmware with State Data-Aware Fuzzing: Accelerating Coverage in Nondeterministic I/O Environments

固态驱动器（SSD）固件管理复杂的内部状态，包括闪存维护。由于非确定性I/O操作，传统的测试方法难以快速实现需要大量I/O积累的固件代码区域的覆盖范围。为了应对这一挑战，我们提出了一种州数据感知的模糊方法，该方法利用SSD固件的内部状态指导在非确定I/O条件下的输入生成并加速覆盖范围发现 ...

0 0 0 2025/06/04 arXiv:2505.03062v1 mike_zhang

Bottom-Up Synthesis of Knowledge-Grounded Task-Oriented Dialogues with Iteratively Self-Refined Prompts

培训对话提问（QA）系统需要大量的内域数据，这在实践中通常很少。解决这一挑战的一个常见解决方案是生成合成数据。传统方法通常遵循自上而下的方法，其中大语言模型（LLM）从广义提示中生成多转对话 ...

0 0 0 2025/06/04 arXiv:2504.14375v1 waterfall666

Boundary Attention: Learning to Localize Boundaries under High Noise

我们提出了一个可微分模型，使用我们称为边界注意的机制来推断显式边界，包括曲线、拐角和交汇处。边界注意力是一种边界感知局部注意力操作，当密集且重复地应用时，它会逐步细化变量字段，这些变量指定图像中每个重叠补丁中局部边界结构的非光栅化描述。它以自下而上的方式运行，类似于亚像素边缘定位和边缘链接的经典方法，但具有局部边界结构的高维描述、学习而不是设计的空间一致性概念以及端到端可微分的操作序列 ...

0 0 0 2025/06/04 arXiv:2401.00935v3 老师这篇SCI真的要给我吗

PCoreSet: Effective Active Learning through Knowledge Distillation from Vision-Language Models

知识蒸馏（KD）是通过利用教师模型的知识来训练紧凑，特定于任务模型的广泛使用的框架。但是，其在主动学习中的应用（AL）旨在通过迭代样本选择最大程度地降低注释成本，但仍未得到充实。这一差距源于KD通常假设访问足够标记的数据的事实，而AL在数据筛选的情况下运行，而这些方案通常无法获得特定于任务的教师模型 ...

0 0 0 2025/06/04 arXiv:2506.00910v1 haoyi199815

Dense Communication between Language Models

随着高级智能从模块化组件与低级智能的结合出现，许多作品结合了集体智能的大型语言模型（LLMS）。通过在LLM之间建立通信来实现此类组合。尽管当前的系统主要通过自然语言促进这种交流，但本文提出了一种新颖的LLM之间直接密集矢量通信的范式 ...

0 0 0 2025/06/04 arXiv:2505.12741v1 waterfall666

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）