用户对人工智能代理的接受程度可能取决于他们解释推理的能力,这需要添加一个可解释层来帮助用户理解他们的行为。本文重点是在语义文本相似度(STS)之上添加一个可解释层,用于衡量两个句子之间的语义等价程度。可解释性层被形式化为两个句子中的段对之间的对齐,其中段之间的关系用关系类型和相似性分数来标记 ...

0 0 0 0 2024/05/14 arXiv:1612.04868v1 cjwbuaa

即使 BERT 等预训练语言编码器在许多任务中共享,问答、文本分类和回归模型的输出层也有显着不同。跨度解码器经常用于问答、固定类、文本分类的分类层以及回归任务的相似性评分层。我们表明这种区别是没有必要的,并且所有三者都可以统一为跨度提取。统一的跨度提取方法可以在多个问答、文本分类和回归基准的补充监督预训练、低数据和多任务学习实验中带来优异或相当的性能 ...

0 0 0 0 2024/05/02 arXiv:1904.09286v2 cjwbuaa

一些 NLP 任务可以通过提供带有自然语言“任务描述”的预训练语言模型以完全无监督的方式解决(例如 Radford 等人) ...

0 0 0 0 2024/04/30 arXiv:2001.07676v3 cjwbuaa

丰富的用户行为数据已被证明对于点击率预测任务具有巨大价值,尤其是在推荐系统和在线广告等工业应用中。业界和学术界都非常关注这个话题,并提出了不同的方法来对长序列用户行为数据进行建模。其中,阿里巴巴提出的基于记忆网络的模型MIMN,通过学习算法和服务系统的协同设计,实现了SOTA ...

0 0 0 0 2024/04/22 arXiv:2006.05639v2 cjwbuaa

工业推荐系统通常由匹配阶段和排名阶段组成,以处理数十亿规模的用户和商品。匹配阶段检索与用户兴趣相关的候选项目,而排名阶段则根据用户兴趣对候选项目进行排序。因此,最关键的能力是对任一阶段的用户兴趣进行建模和表示 ...

0 0 0 0 2024/04/21 arXiv:1904.08030v1 cjwbuaa

在本文中,我们介绍了 DiarizationLM,这是一个利用大型语言模型 (LLM) 对说话者二值化系统的输出进行后处理的框架。使用所提出的框架可以实现各种目标,例如提高分类记录的可读性,或降低单词分类错误率(WDER)。在此框架中,自动语音识别(ASR)和说话人分类系统的输出表示为紧凑的文本格式,该格式包含在可选微调的 LLM 的提示中 ...

0 0 0 0 2024/04/21 arXiv:2401.03506v4 cjwbuaa

推荐系统在现代电子商务平台中起着至关重要的作用。由于用户和物品之间缺乏历史交互,冷启动推荐是一个具有挑战性的问题。为了缓解冷启动问题,大多数现有方法引入内容和上下文信息作为辅助信息 ...

0 0 0 0 2024/04/15 arXiv:2108.09141v1 cjwbuaa

分类器可能依赖于源自特征与训练数据集中的分类目标之间的强相关性的附带特征。最近,众所周知,使用组平衡数据集的最后一层再训练(LLR)可以有效地减轻分类器的虚假相关性。然而,群体平衡数据集的获取成本高昂,这阻碍了LLR方法的适用性 ...

0 0 0 0 2024/04/10 arXiv:2311.18291v1 cjwbuaa

Doc2Query——在使用序列到序列模型建立索引之前扩展文档内容的过程——已经成为提高搜索引擎第一阶段检索效率的一项重要技术。然而,众所周知,序列到序列模型容易产生源文本中不存在的“幻觉”内容。我们认为 Doc2Query 确实容易产生幻觉,这最终会损害检索效率并夸大索引大小 ...

0 0 0 0 2024/04/07 arXiv:2301.03266v3 cjwbuaa

我们提出了一种简单有效的方法来将现有的句子嵌入模型扩展到新的语言。这允许从以前的单语言模型创建多语言版本。训练基于这样的想法:翻译的句子应该映射到向量空间中与原始句子相同的位置 ...

0 0 0 0 2024/04/07 arXiv:2004.09813v2 cjwbuaa

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)