我们第一个论证,仅从语音音频中学习强大的表示,对听力语音进行校准可以超越最好的半监督方法,同时在概念上更简单。 wav2vec 2.0 在子空间中听力语音输入,并通过共同学习的潜在表征来解决对比任务... ...
指令训练(IT)是利用指令-响应对训练大型语言模型(LLMs)的过程,已成为将基础预训练 LLMs 转化为开放域对话代理的主要方法。虽然信息技术取得了显著的成功并被广泛采用,但其局限性和不足之处仍未得到充分探索。在本文中,我们通过严格的实验和对 LLM 通过 IT 所发生的变化的深入分析,揭示了 IT 的各种局限性...
由于基于大 LLM (LLM)的聊天助手具有广泛的能力,现有基准在我们人类偏好方面存在不足,因此对此进行评估。为了解决这个问题,探索使用强大的 LLM 作为评估委员会,就对这些模型进行评估。我们研究了大语言模型评价委员会的缓解和限制,包括更主动的口头禅和自我强化偏差,以及有限的推理能力,并提出了作为解决其中一些问题的解决方案方案... ...
自我学习监督(SSL)在语音识别方面取得了巨大的成功,但在其他语音处理任务方面的探索还很有限。由于语音信号包含说话人身份、副语言学、说话内容等多方面信息,因此学习适用对于所有语音任务的通用表征具有挑战性。... ...