搜索引擎通常遵循两阶段范例,其中在第一阶段(检索阶段)检索初始文档集,在第二阶段(重新排名阶段)对文档重新排名以获得最终结果列表。虽然在之前的工作中,深度神经网络被证明可以提高重新排序阶段的性能,但很少有关于使用深度神经网络来改善检索阶段的文献。在本文中,我们研究了检索阶段结合深度神经网络模型和词汇模型的优点 ...

0 0 0 0 2024/08/15 arXiv:2010.01195v1 ajingo

我们研究了实用且可扩展的算法,用于训练具有用户级差分隐私(DP)的大型语言模型(LLM),以便可靠地保护每个用户贡献的所有示例。我们研究了 DP-SGD 的两种变体:(1) 示例级采样 (ELS) 和每示例梯度裁剪,以及 (2) 用户级采样 (ULS) 和每用户梯度裁剪。我们推导出一种新颖的用户级 DP 会计师,使我们能够为 ELS 计算可证明的严格隐私保证 ...

0 0 0 0 2024/07/14 arXiv:2407.07737v1 ajingo

具有人类反馈的强化学习 (RLHF) 使用偏好数据集对预训练的大语言模型 (LLM) 进行微调,使 LLM 能够生成符合人类偏好的输出。考虑到不同客户持有的这些偏好数据集的敏感性,需要在联邦学习 (FL) 框架内实施 RLHF,而客户出于隐私问题不愿意共享其数据。为了解决这个问题,我们引入了一个可行的框架,其中客户使用我们提出的 FedBis 以其偏好数据集协作训练二元选择器 ...

0 0 0 0 2024/07/09 arXiv:2407.03038v1 ajingo

下游场景优化大型语言模型(LLM)通常涉及通过进一步定制预的LLM。Meta公开发布的Llama模型和OpenAI用于在自定义数据集上关系GPT-3.5 Turbo的API也鼓励了这种做法... ...

0 0 0 0 2025/01/11 arXiv:2310.03693v1 ajingo

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)