本文考虑了一种集成传感和通信系统,其中一些雷达目标也充当通信散射体。提出了一种基于散射环境中目标和散射体位置的位置域信道建模方法,所得雷达和通信信道表现出二维(2-D)联合突发稀疏性。我们提出了一种联合散射环境感知和信道估计方案,以同时增强目标/散射体定位和信道估计性能,其中提出了空间非平稳马尔可夫随机场(MRF)模型来捕获二维联合突发稀疏性。设计了一种基于期望最大化(EM)的方法来解决联合估计问题,其中E步获得雷达和通信信道的贝叶斯估计,M步自动学习MRF中的动态位置网格和先验参数。然而,E-step 中使用的现有稀疏贝叶斯推理方法涉及每次迭代的高复杂度矩阵逆。而且,由于复杂的非平稳MRF先验,M步的复杂度呈指数级增长。为了解决这些困难,我们提出了一种针对 E 步的无逆变分贝叶斯推理算法和针对 M 步的基于伪似然近似的低复杂度方法。在模拟中,所提出的方案可以实现比最先进的方法更好的性能,同时显着减少计算开销 ...

0 0 0 0 2025/12/24 arXiv:2302.02587v2 ZYJ

语音到文本翻译涉及将一种语言的语音信号转换为另一种语言的文本的任务。它适用于各个领域,例如免提通信、听写、视频讲座转录和翻译等。自动语音识别(ASR)和机器翻译(MT)模型在传统的原文翻译中发挥着至关重要的作用,能够将口语的原始形式转换为书面文本,并促进无缝的跨语言交流。 ASR 识别口语单词,而 MT 将转录文本翻译成目标语言。这种分散的模型会遭受级联错误传播以及高昂的资源和培训成本。因此,研究人员一直在探索原文翻译的端到端(E2E)模型。然而,据我们所知,目前还没有对 E2E ST 现有工作进行全面的回顾。因此,本次调查讨论了这个方向的工作。我们的尝试是对 ST 任务所使用的模型、指标和数据集进行全面审查,为挑战和未来的研究方向提供新的见解。我们相信这篇综述将对研究 ST 模型的各种应用的研究人员有所帮助 ...

0 0 0 0 2025/12/24 arXiv:2312.01053v2 yangwenjie

强化学习对于增强大型语言模型的推理能力至关重要,但当前的探索机制仍然与这些模型的实际学习方式根本不相符。熵奖励和外部语义比较器鼓励表面水平变化,但不能保证采样轨迹在形状优化的更新方向上有所不同。我们提出了 G2RL,一种梯度引导强化学习框架,其中探索不是由外部启发式驱动,而是由模型自身的一阶更新几何驱动。对于每个响应,G2RL 根据模型最后一层的敏感性构建序列级特征,该特征可以通过标准前向传递以可忽略不计的成本获得,并通过比较采样组内的这些特征来衡量每个轨迹将如何重塑策略。引入新颖梯度方向的轨迹接收有界乘法奖励缩放器,同时不强调冗余或偏离流形更新,产生与 PPO 风格稳定性和 KL 控制自然一致的自参考探索信号。在 Qwen3 基础 1.7B 和 4B 模型上的数学和一般推理基准测试(MATH500、AMC、AIME24、AIME25、GPQA、MMLUpro)中,G2RL 持续改进了基于熵的 GRPO 和外部嵌入方法的 pass@1、maj@16 和 pass@k。分析诱导几何,我们发现 G2RL 将探索扩展到更加正交且通常相反的梯度方向,同时保持语义连贯性,这表明策略自身的更新空间为指导大型语言模型强化学习的探索提供了更加忠实和有效的基础 ...

0 1 0 0 2025/12/24 arXiv:2512.15687v1 Qxxx2616

大规模推荐模型从庞大的目录中找到最相关的项目,它们在现代搜索和推荐系统中发挥着至关重要的作用。为了对具有大词汇量分类特征的输入空间进行建模,典型的推荐模型通过神经网络从用户反馈数据中学习查询和项目的联合嵌入空间。然而,由于语料库中有数百万到数十亿的项目,用户倾向于为其中的一小部分提供反馈,从而导致幂律分布。这使得长尾项目的反馈数据极其稀疏。受最近在计算机视觉和自然语言理解领域自监督表示学习研究取得的成功的启发,我们提出了一种用于大规模项目推荐的多任务自监督学习(SSL)框架。该框架旨在通过学习更好的项目特征的潜在关系来解决标签稀疏问题。具体来说,SSL 改进了项目表示学习,并作为额外的正则化来提高泛化能力。此外,我们提出了一种新颖的数据增强方法,该方法利用所提出的框架内的特征相关性。我们使用两个分别具有 500M 和 1B 训练示例的真实数据集来评估我们的框架。我们的结果证明了 SSL 正则化的有效性,并显示了其优于最先进的正则化技术的性能。我们还已经将所提出的技术推出到网络规模的商业应用程序到应用程序推荐系统中,并在实时流量的 A/B 实验中证明了顶级业务指标的显着改进。我们的在线结果也验证了我们的假设,即我们的框架确实在缺乏监督的切片上进一步提高了模型性能 ...

0 1 0 0 2025/12/24 arXiv:2007.12865v4 CoooolTu

面向任务的解析 (TOP) 使会话助理能够解释以自然语言表达的用户命令,将其转换为结合自然语言和意图/槽标签元素的结构化输出。最近,大型语言模型(LLM)在基于自然语言提示合成计算机程序方面取得了令人印象深刻的性能,缩小了自然语言和结构化程序之间的差距。我们的论文重点是利用 LLM 的能力来完成语义解析任务,解决以下三个关键研究问题:1)如何有效地利用 LLM 来完成语义解析任务? 2) 有效提示的定义是什么? 3) LLM 如何通过将所有示例作为提示来克服长度限制并简化提示设计?我们引入了 k 最近邻上下文学习 (kNN-ICL),它允许将其构建在任何设计策略之上,同时提供对所有演示示例的访问,从而简化了即时工程。大量实验表明:1)无需 kNN 搜索的简单 ICL 可以在 TOP 任务上实现与强监督模型相当的性能,2)kNN-ICL 通过将 ICL 与最近邻方法无缝集成,显着提高了对复杂请求的理解。值得注意的是,这种增强是在不需要额外数据或专门提示的情况下实现的 ...

0 0 0 0 2025/12/24 arXiv:2312.10771v1 DaisyIvan

一体化图像恢复模型的最新进展彻底改变了通过统一框架解决各种退化问题的能力。然而,与特定任务相关的参数通常对其他任务保持不活动状态,这使得专家混合 (MoE) 架构成为自然的扩展。尽管如此,MoE 经常表现出不一致的行为,一些专家出乎意料地对任务进行概括,而另一些专家则在其预期范围内苦苦挣扎。这阻碍了在推理过程中绕过不相关专家来利用 MoE 的计算优势。我们将这种不良行为归因于传统 MoE 的统一且严格的架构。为了解决这个问题,我们引入了“复杂性专家”——具有不同计算复杂性和接受域的灵活专家块。一个关键的挑战是将任务分配给每个专家,因为退化复杂性事先是未知的。因此,我们执行任务时简单地偏向于较低的复杂性。令我们惊讶的是,这种偏好有效地驱动了特定于任务的分配,将任务分配给具有适当复杂性的专家。大量的实验验证了我们的方法,证明了在推理过程中绕过不相关专家的能力,同时保持卓越的性能。所提出的 MoCE-IR 模型优于最先进的方法,证实了其效率和实际适用性,源代码和模型可在 \href{this https URL}{\texttt{this http URL}} 公开获得 ...

0 0 0 0 2025/12/24 arXiv:2411.18466v2 Roa

大型语言模型(LLM)在规划长期现实世界任务方面表现出强大的推理能力,但现有的代理基准测试侧重于任务完成,而忽略了并行和异步操作的时间效率。为了解决这个问题,我们推出了 ParaCook,这是一个高效协作规划的基准。受 Overcooked 游戏的启发,ParaCook 为实例化为烹饪任务的多智能体系统的各种具有挑战性的交互规划提供了一个环境,并通过简化的动作空间来隔离战略并行规划的核心挑战。通过对最先进的 LLM 的全面评估,我们发现当前的方法实现了次优计划,难以并行行动或协调。我们的分析还揭示了 LLM 在抽象任务上的潜力,他们可以专注于高级并行优化。 ParaCook 提供了一个可扩展的评估框架,其复杂性可调节,为开发和评估时间效率感知的多智能体规划奠定了基础。代码和数据可从此 https URL 获取 ...

0 0 0 0 2025/12/24 arXiv:2510.11608v1 wanglei

利用最新的扩散模型,基于 LiDAR 的大规模 3D 场景生成取得了巨大成功。虽然最近基于体素的方法可以生成几何结构和语义标签,但现有的范围视图方法仅限于生成未标记的激光雷达场景。依靠预训练的分割模型来预测语义图通常会导致跨模式一致性不佳。为了解决这一限制,同时保留距离视图表示的优点,例如计算效率和简化的网络设计,我们提出了 Spiral,这是一种新颖的距离视图 LiDAR 扩散模型,可以同时生成深度、反射图像和语义图。此外,我们引入了新颖的语义感知指标来评估生成的标记范围视图数据的质量。 SemanticKITTI 和 nuScenes 数据集上的实验表明,Spiral 以最小的参数大小实现了最先进的性能,优于结合生成模型和分割模型的两步方法。此外,我们验证了 Spiral 生成的距离图像可以有效地用于下游分割训练中的合成数据增强,从而显着减少 LiDAR 数据的标记工作 ...

0 0 0 0 2025/12/24 arXiv:2505.22643v3 leonupup

最大熵方法植根于统计物理学中的伊辛/波茨逆问题,被广泛用于模拟生物信息学和神经科学等跨学科复杂系统中的成对相互作用。虽然这些方法很成功,但通常无法捕获对于理解集体行为至关重要的高阶交互。相比之下,现代机器学习方法可以对此类交互进行建模,但其可解释性往往会带来高昂的计算成本。受限玻尔兹曼机 (RBM) 通过二分架构中的隐藏单元对统计相关性进行编码,提供了一种计算高效的替代方案。在这项工作中,我们引入了一种将 RBM 映射到广义 Potts 模型的方法,从而能够系统地提取任意阶的相互作用。利用 RBM 结构易于处理的大 $N$ 近似,我们以最小的计算量提取有效的多体耦合。我们进一步提出了一个稳健的框架,用于在更复杂的生成模型中恢复高阶交互,并为有效的 Potts 表示引入一个简单的规范固定方案。合成数据的验证证明了二体和三体相互作用的准确恢复。应用于蛋白质序列数据时,我们的方法以高保真度重建接触图,并且优于最先进的逆 Potts 模型。这些结果使 RBM 成为一种强大且高效的工具,用于对高维分类数据中的高阶结构进行建模 ...

0 0 0 0 2025/12/24 arXiv:2501.06108v5 arxiv_user

我们介绍米开朗基罗:一种针对大型语言模型的最小的、综合的、未泄露的长上下文推理评估,并且也很容易自动评分。这种评估是通过一个新颖的、统一的框架对任意长的上下文进行评估而得出的,该框架衡量模型的能力不仅仅是从上下文中检索单个信息。潜在结构查询框架(LSQ)的中心思想是构建需要模型“凿掉”上下文中不相关信息的任务,从而揭示上下文中的潜在结构。为了验证模型对这种潜在结构的理解,我们查询模型以获取结构的详细信息。使用 LSQ,我们跨代码和自然语言领域进行了三个诊断性长上下文评估,旨在提供更强的长上下文语言模型功能信号。我们对几种最先进的模型进行了评估,并证明了a)所提出的评估是高信号的,b)在合成长上下文信息方面还有很大的改进空间 ...

0 0 0 0 2025/12/24 arXiv:2409.12640v2 yiyili