一译 —— 文档和论文翻译、对照阅读、讨论和社区

A Wireless Foundation Model for Multi-Task Prediction

随着移动通信网络的复杂性和动态的日益增长，可以准确预测关键系统参数，例如通道状态信息（CSI），用户位置和网络流量，对于广泛的物理（PHY） - 层次和中等访问控制（MAC） - 莱默任务而变得至关重要。尽管基于传统的深度学习（DL）方法已广泛应用于此类预测任务，但它们通常很难跨越不同的情况和任务。作为回应，我们提出了一个支持不同预测间隔的无线网络中多任务预测的统一基础模型 ...

0 0 0 2025/09/10 arXiv:2507.05938v2 HeiHuZi

Reverse-Engineered Reasoning for Open-Ended Generation

尽管``深层推理''范式刺激了数学等可验证领域的重大进展，但其在开放式，创造性生成的应用仍然是一个关键挑战。灌输推理的两种主要方法 - 加强学习（RL）和指导蒸馏 - 在这一领域步履蹒跚； RL在缺乏明确的奖励信号和高质量奖励模型的情况下进行斗争，而蒸馏的昂贵，并且由教师模型的能力限制。为了克服这些限制，我们引入了反设计推理（REER），这是一种从根本上改变方法的新范式 ...

0 0 0 2025/09/10 arXiv:2509.06160v1 qq466943803

GNNs as Predictors of Agentic Workflow Performances

大型语言模型（LLMS）调用的代理工作流在处理复杂任务方面取得了巨大的成功。但是，由于LLM的广泛调用，在现实世界中，优化此类工作流程的成本高昂且效率低下。为了填补这一空白，该位置纸张将代理工作流程作为计算图和倡导者图形神经网络（GNN）作为代理工作流程的有效预测指标，避免重复进行评估的LLM调用 ...

0 0 0 2025/09/10 arXiv:2503.11301v1 hhhhh

Efficient Source-Free Time-Series Adaptation via Parameter Subspace Disentanglement

在本文中，我们提出了一个在时间序列的有效无源域适应（SFDA）的框架，重点是增强参数效率和数据样本的利用率。我们的方法引入了改进的源模型制备和目标侧适应的范式，旨在提高目标适应过程中的训练效率。具体而言，我们以塔克式分解方式对源模型的权重进行重新聚集，在源模型制备阶段将模型分解为紧凑的形式 ...

0 0 0 2025/09/10 arXiv:2410.02147v2 haoyb22

On the Identification of Temporally Causal Representation with Instantaneous Dependence

从时间序列观察中，因果关系从时间序列观察中确定潜在因果过程，但是大多数方法都需要假设潜在的因果过程没有瞬时关系。尽管一些最近的方法在瞬时因果关系中实现了可识别性，但它们需要对潜在变量进行干预或观测值分组，这通常在现实世界中很难获得。为了填补这一空白，我们提出了一个\ textbf {id} intertific \ textbf {o}的实体框架，我们的\ textbf {l} atent dyn ...

0 0 0 2025/09/10 arXiv:2405.15325v2 haoyb22

From Editor to Dense Geometry Estimator

利用预先训练的文本对图像（T2I）生成模型的视觉先验已显示在密集预测中的成功。但是，密集的预测本质上是图像到图像的任务，表明图像编辑模型而不是T2i生成模型可能是进行微调的更合适的基础。在此激励的情况下，我们对编辑器和发电机的微调行为进行系统分析，以进行密集的几何估计 ...

0 0 0 2025/09/10 arXiv:2509.04338v1 KingXHJ

Quantization Variation: A New Perspective on Training Transformers with Low-Bit Precision

尽管《 Transformer 》在语言和视觉任务中都表现出色，但扩大的计算和模型大小已增加了对有效部署的需求。为了解决重度计算和参数缺点，在社区中经常研究量化作为代表性模型压缩技术，并在Convnets上进行了广泛使用。但是，由于 Transformer 的独特属性，低位量化应用程序仍然受到限制且毫无疑问 ...

0 0 0 2025/09/10 arXiv:2307.00331v2 felixslu

Gated Attention for Large Language Models: Non-linearity, Sparsity, and Attention-Sink-Free

从LSTM和公路网络等早期模型到最近的状态空间模型，线性注意力以及软磁心的关注，门控机制已被广泛使用。然而，现有文献很少检查门控的特定影响。在这项工作中，我们进行了全面的实验，以系统地研究门控的SoftMax注意变体 ...

0 0 0 2025/09/10 arXiv:2505.06708v1 congshijun

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）