大型语言模型(LLM)在推理任务上表现出了卓越的性能。他们利用自回归标记生成来构建推理轨迹,从而形成连贯的思想链。在这项工作中,我们探讨了单个标记对推理任务最终结果的影响 ...
语音语言模型(SLM)为统一语音和文本理解和产生提供了有希望的途径。但是,在实现有效的跨模式一致性和高质量的语音产生方面仍然存在挑战。在这项工作中,我们系统地研究语音 Token 设计在以LLM为中心的SLM中的作用,并通过语音头和扬声器建模增强 ...
重新排列对于优化推荐列表的推荐系统至关重要,从而提高了用户满意度和平台收入。大多数现有的方法遵循生成器评估器范式,评估器估算每个候选列表的总体值。但是,他们通常会忽略用户在消耗完整列表之前退出的事实,从而导致估计的发电价值与实际消耗价值之间的不匹配 ...
顺序激励营销是在线业务获取客户,提高忠诚度并提高销售额的重要方法。如何有效分配激励措施以最大化回报(例如 ...
相机传感器模拟是自动驾驶(AD)的关键作用,例如评估基于视觉的AD算法 ...
模拟在评估自主驾驶系统中起着至关重要的作用,在自主驾驶系统中,实际的多代理行为是关键方面。在多代理模拟中,主要挑战包括行为多模式和闭环分布变化。在这项研究中,我们重新审视用于生成多模式剂行为的混合模型,该模型可以涵盖包括连续混合模型和类似GPT的离散模型在内的主流方法 ...
从有限的照片中,最新的方法来渲染了逼真的观点,从而突破了我们与静态场景图片的互动的界限。重现时刻的能力,即时变序列,也许是一个更有趣的场景,但在很大程度上尚未解决。我们介绍了DCT-NERF,这是一种用于动态场景的基于坐标的神经表示 ...
直接偏好优化(DPO)已成为训练大语模型(LLMS)以遵守人类偏好的引人注目的方法。但是,DPO的性能对其权衡参数$ \ beta $的微调以及优先数据的质量敏感。我们分析了$ \ beta $和数据质量对DPO的影响,发现该最佳$ \ beta $值随成对数据的信息而变化 ...
大型语言模型(LLM)的最新成功促使他们在各个领域的应用。特别是,已经努力将LLM集成到无线通信系统的各个方面。 LLM在无线通信系统中的使用有可能实现人工通用情报(AGI)启用的无线网络 ...
基于大型语言模型(LLM)的自动语音识别(ASR)实现了强劲的性能,但通常会产生高计算成本。这项工作研究了如何有效地获得最佳的LLM-ASR性能。通过全面和受控的实验,我们发现在将语音编码器与LLM集成之前对语音编码器进行预处理会导致比LLM-ASR联合训练后培训的标准实践明显更好地缩放效率 ...