一译 —— 文档和论文翻译、对照阅读、讨论和社区

FDA Jamming Against Airborne Phased-MIMO Radar-Part I: Matched Filtering and Spatial Filtering

分阶段的多输入多输出（分阶段）雷达雷达越来越受到关注，因为它享受了波形多样性的优势和频率多样的阵列MIMO（FDA-MIMO）雷达的范围依赖性，而无需通过分区发射子阵列来牺牲相干处理增益。这个两部分的系列提出了一个受频率不同阵列（FDA）雷达启发的电子对策（ECM）的框架，称为FDA干扰，评估了其对抗机载的梯级模拟物雷达的有效性。该部分介绍了FDA干扰器的原理和类别，并提出了基于两个阶段MIMO雷 ...

0 0 0 2025/06/26 arXiv:2408.03050v1 mmmmp

Detect Anything 3D in the Wild

尽管在近距离3D对象检测中深入学习取得了成功，但现有的方法在新型对象和摄像机配置中零弹性概括。我们介绍了Detany3D，这是一个迅速的3D检测基础模型，该模型能够仅使用单眼输入来检测任意摄像机配置下的任何新颖对象。培训3D检测的基础模型从根本上受到注释3D数据的可用性有限的限制，这激发了Detany3D利用广泛预先训练的2D基础模型嵌入的丰富先验知识来弥补这种稀缺性 ...

0 0 0 2025/06/26 arXiv:2504.07958v2 xiaozhi

Leaky Thoughts: Large Reasoning Models Are Not Private Thinkers

我们在用作个人代理的大型推理模型的推理轨迹中研究隐私泄漏。与最终输出不同，通常认为推理轨迹是内部和安全的。我们通过表明推理轨迹经常包含敏感用户数据来挑战这一假设，该数据可以通过提示注射或意外泄漏到输出中提取 ...

0 0 0 2025/06/26 arXiv:2506.15674v1 keve

How to Train Long-Context Language Models (Effectively)

我们研究语言模型（LM）的持续训练和监督微调（SFT），以有效利用长上下文信息。我们首先建立一个可靠的评估协议来指导模型开发——我们使用一组广泛的长上下文任务，而不是困惑或简单的大海捞针（NIAH）测试，并在 SFT 后使用指令数据评估模型因为这可以更好地揭示长上下文能力。在我们强大的评估的支持下，我们进行了彻底的实验来决定继续预训练的数据组合、指令调整数据集和许多其他设计选择 ...

0 0 0 2025/06/26 arXiv:2410.02660v2 sarah

Gated Linear Attention Transformers with Hardware-Efficient Training

具有线性注意力的 Transformer 可以实现高效的并行训练，但同时可以表示为具有 2D（矩阵值）隐藏状态的 RNN，从而享受线性时间推理复杂性。然而，线性注意力通常不如普通的 softmax 注意力。此外，当前的线性注意力实现缺乏 I/O 感知，因此比高度优化的 softmax 注意力实现慢 ...

0 0 0 2025/06/26 arXiv:2312.06635v6 slowlyc2

Revisiting Feature Interactions from the Perspective of Quadratic Neural Networks for Click-through Rate Prediction

Hadamard产品（HP）长期以来一直是点击率（CTR）预测任务的基石，因为它的简单性，有效性和捕获没有其他参数的功能相互作用的能力。但是，其有效性的根本原因尚不清楚。在本文中，我们从二次神经网络（QNN）的角度重新访问了HP，该二次神经网络（QNN）利用二次交互术语来建模复杂的特征关系 ...

0 0 0 2025/06/26 arXiv:2505.17999v2 xuwenlong

OmniAvatar: Efficient Audio-Driven Avatar Video Generation with Adaptive Body Animation

在音频驱动的人类动画中已经取得了重大进展，而大多数现有方法主要集中在面部运动上，从而限制了它们以自然同步和流动性创建全身动画的能力。他们还以精确的迅速控制而挣扎，以获得细粒度。为了应对这些挑战，我们引入了Omniavatar，这是一种创新的音频驱动的全身视频生成模型，可通过提高LIP-Sync的精度和自然动作来增强人类动画 ...

0 0 0 2025/06/26 arXiv:2506.18866v1 KingYi

Multifaceted Evaluation of Audio-Visual Capability for MLLMs: Effectiveness, Efficiency, Generalizability and Robustness

多模式的大语言模型（MLLM）最近在处理和理解各种方式（例如文本，音频和视觉信号）的信息方面取得了巨大成功 ...

0 0 0 2025/06/26 arXiv:2504.16936v1 zhangqi33

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）