大型语言模型 (LLM) 已被证明在各种句法、话语和推理任务中表现良好。虽然 LLM 越来越多地以多种形式部署,包括与人类互动的对话代理,但我们缺乏一个坚实的基准来衡量 LLM 对 \textit{social} 语言的理解程度。在这里,我们引入了一个新的理论驱动基准 SocKET,它包含 58 个测试社会知识的 NLP 任务,我们将其分为五类:幽默和讽刺、攻击性、情绪和情感以及可信度 ...
0 0 0 2024/05/16 arXiv:2305.14938v2 chendl
当公钥证书被泄露时,即当关联的私钥暴露给未经授权的实体时,需要吊销公钥证书。然而,撤销过程往往不可靠。撤销的替代方法是颁发一系列证书,每个证书的有效期都很短,并在受到损害时终止该序列。本备忘录提出了自动证书管理环境 (ACME) 扩展,以实现短期自动续订 (STAR) X.509 证书的颁发 ...
0 0 0 2024/05/16 rfc:8739 rfc
本文重新审视了 NLP 领域中分布外(OOD)鲁棒性的研究。我们发现,以往研究中的分布偏移设置通常缺乏足够的挑战,阻碍了 OOD 稳健性的准确评估。为了解决这些问题,我们提出了一个基准构建协议,以确保明显的差异化和具有挑战性的分布变化 ...
0 0 0 2024/05/16 arXiv:2306.04618v2 Datow
本文档指定了自动证书管理环境 (ACME) 为 IP 地址颁发证书所需的标识符和质询 ...
0 0 0 2024/05/16 rfc:8738 rfc
虽然大型语言模型 (LLM) 已表现出卓越的多任务处理能力,但通常需要在下游、特定领域的数据集上对这些模型进行微调,以便与未经微调的模型相比,在测试集上产生卓越的性能。然而,微调对 LLM 泛化能力的综合影响尚不完全清楚。本文深入探讨了原始的、未经修改的 LLM 及其微调变体之间的差异 ...
0 0 0 2024/05/16 arXiv:2403.09162v1 Datow
本文档指定了自动证书管理环境 (ACME) 协议的新挑战,该协议允许使用 TLS 进行域控制验证 ...
0 0 0 2024/05/16 rfc:8737 rfc
无监督跨域图像检索(UCIR)旨在检索跨不同域共享同一类别的图像,而不依赖于标记数据。先前的方法通常将 UCIR 问题分解为两个不同的任务:域内表示学习和跨域特征对齐。然而,这些分离的策略忽视了这些任务之间的潜在协同作用 ...
0 0 0 2024/05/16 arXiv:2402.18411v2 yonghengzhijian
盲脸恢复通常依赖于面部先验,例如面部几何先验或参考先验,来恢复真实且忠实的细节。然而,质量非常低的输入无法提供准确的几何先验,而高质量的参考也无法访问,从而限制了其在现实场景中的适用性。在这项工作中,我们提出了 GFP-GAN,它利用封装在预训练人脸 GAN 中的丰富多样的先验来进行盲脸恢复 ...
0 0 0 2024/05/16 arXiv:2101.04061v2 SOOKIE

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)