arxiv的文档

arxiv 南京

个性签名 ...

Critical Tokens Matter: Token-Level Contrastive Estimation Enhances LLM's Reasoning Capability

大型语言模型（LLM）在推理任务上表现出了卓越的性能。他们利用自回归标记生成来构建推理轨迹，从而形成连贯的思想链。在这项工作中，我们探讨了单个标记对推理任务最终结果的影响 ...

0 0 0 0 2025/08/07 arXiv:2411.19943v3 建文落叶

What Makes a Good Speech Tokenizer for LLM-Centric Speech Generation? A Systematic Study

语音语言模型（SLM）为统一语音和文本理解和产生提供了有希望的途径。但是，在实现有效的跨模式一致性和高质量的语音产生方面仍然存在挑战。在这项工作中，我们系统地研究语音 Token 设计在以LLM为中心的SLM中的作用，并通过语音头和扬声器建模增强 ...

0 0 0 0 2025/08/07 arXiv:2506.12537v2 rosyclouds

From Generation to Consumption: Personalized List Value Estimation for Re-ranking

重新排列对于优化推荐列表的推荐系统至关重要，从而提高了用户满意度和平台收入。大多数现有的方法遵循生成器评估器范式，评估器估算每个候选列表的总体值。但是，他们通常会忽略用户在消耗完整列表之前退出的事实，从而导致估计的发电价值与实际消耗价值之间的不匹配 ...

0 0 0 0 2025/08/07 arXiv:2508.02242v1 逸卿

Model-based Constrained MDP for Budget Allocation in Sequential Incentive Marketing

顺序激励营销是在线业务获取客户，提高忠诚度并提高销售额的重要方法。如何有效分配激励措施以最大化回报（例如 ...

0 0 0 0 2025/08/07 arXiv:2303.01049v1 naristlia

DriveCamSim: Generalizable Camera Simulation via Explicit Camera Modeling for Autonomous Driving

相机传感器模拟是自动驾驶（AD）的关键作用，例如评估基于视觉的AD算法 ...

0 0 0 0 2025/08/07 arXiv:2505.19692v1 xubiao

Revisit Mixture Models for Multi-Agent Simulation: Experimental Study within a Unified Framework

模拟在评估自主驾驶系统中起着至关重要的作用，在自主驾驶系统中，实际的多代理行为是关键方面。在多代理模拟中，主要挑战包括行为多模式和闭环分布变化。在这项研究中，我们重新审视用于生成多模式剂行为的混合模型，该模型可以涵盖包括连续混合模型和类似GPT的离散模型在内的主流方法 ...

0 0 0 0 2025/08/07 arXiv:2501.17015v1 xubiao

Neural Trajectory Fields for Dynamic Novel View Synthesis

从有限的照片中，最新的方法来渲染了逼真的观点，从而突破了我们与静态场景图片的互动的界限。重现时刻的能力，即时变序列，也许是一个更有趣的场景，但在很大程度上尚未解决。我们介绍了DCT-NERF，这是一种用于动态场景的基于坐标的神经表示 ...

0 0 0 0 2025/08/07 arXiv:2105.05994v1 lhmd

$β$-DPO: Direct Preference Optimization with Dynamic $β$

直接偏好优化（DPO）已成为训练大语模型（LLMS）以遵守人类偏好的引人注目的方法。但是，DPO的性能对其权衡参数$ \ beta $的微调以及优先数据的质量敏感。我们分析了$ \ beta $和数据质量对DPO的影响，发现该最佳$ \ beta $值随成对数据的信息而变化 ...

0 0 0 0 2025/08/07 arXiv:2407.08639v2 wozengyi

LLM-Empowered Resource Allocation in Wireless Communications Systems

大型语言模型（LLM）的最新成功促使他们在各个领域的应用。特别是，已经努力将LLM集成到无线通信系统的各个方面。 LLM在无线通信系统中的使用有可能实现人工通用情报（AGI）启用的无线网络 ...

0 0 0 0 2025/08/07 arXiv:2408.02944v1 HeiHuZi

Efficient Scaling for LLM-based ASR

基于大型语言模型（LLM）的自动语音识别（ASR）实现了强劲的性能，但通常会产生高计算成本。这项工作研究了如何有效地获得最佳的LLM-ASR性能。通过全面和受控的实验，我们发现在将语音编码器与LLM集成之前对语音编码器进行预处理会导致比LLM-ASR联合训练后培训的标准实践明显更好地缩放效率 ...

0 0 0 0 2025/08/07 arXiv:2508.04096v1 13724122396