一译 —— 文档和论文翻译、对照阅读、讨论和社区

Talking-Heads Attention

我们介绍“谈话头脑的注意”  - 多头注意的一种变化，包括在注意力头维度上的线性质量注射，紧接在软磁性之前和之后，此HTTP URL仅插入少数其他参数，并且在掩盖语言上更好地构建语言，以更好地构建语言，并在掩盖语言上进行更好的回答，以使语言的质量更好地构建，并在掩盖语言上进行更高的质疑，以使其更加良好地构建了质量，并构建了质量的质量。任务.. ...

0 0 0 2025/06/25 arXiv:2003.02436v1 xuwenlong

Improving Ad matching via Cluster-Adaptive Keyword Expansion and Relevance tuning

在搜索广告中，关键字匹配将用户查询与相关广告联系起来。基于 Token 的匹配增加了广告范围，但由于语义过度扩展，它可以降低相关性。这项工作通过文档侧语义关键字扩展扩展了关键字，使用语言模型来扩展 Token 级别的匹配而无需更改查询 ...

0 0 0 2025/06/25 arXiv:2505.18897v1 fokazheng

The RefinedWeb Dataset for Falcon LLM: Outperforming Curated Corpora with Web Data, and Web Data Only

（（）进行训练。这种管理过程被认为是产生具有广泛的零样本泛化能力的高性能模型所必需的。然而，由于考虑到需要对数万亿 Token 进行预训练的大型模型，目前还不清楚管理的可扩展性如何，以及我们是否会很快用完独特的高质量数据... ...

0 0 0 2025/06/25 arXiv:2306.01116v1 ZhangZhang957

Finding the Trigger: Causal Abductive Reasoning on Video Events

本文介绍了一个新问题，即视频事件（CARVE）的因果关系推理，其中涉及确定视频中事件之间的因果关系，并生成有关因果关系链的假设，这些因果链说明了目标事件的发生。为了促进朝这个方向进行研究，我们创建了两个新的基准数据集，其中包括合成和现实视频，并伴随着通过新型的反事实合成方法生成的触发目标标签。为了探索解决雕刻的挑战，我们提出了一个因果事件关系网络（CERN），该网络研究了时间和语义空间中的视频事件 ...

0 0 0 2025/06/25 arXiv:2501.09304v1 TJ

WavReward: Spoken Dialogue Models With Generalist Reward Evaluators

诸如GPT-4O-Audio之类的端到端口语对话模型最近在语音领域引起了极大的关注。但是，对对话模型的对话性能的评估在很大程度上被忽略了。这主要是由于智能聊天机器人传达了大量非文本信息，这些信息无法使用基于文本的语言模型（例如ChatGpt）轻松测量 ...

0 0 0 2025/06/25 arXiv:2505.09558v1 zhangqi33

An unfolding method based on conditional Invertible Neural Networks (cINN) using iterative training

检测器效应的展开对于将数据与理论预测进行比较至关重要。虽然传统方法仅限于在较少数量的维度中表示数据，但机器学习使新的展开技术在保留完整的维度的同时。诸如可逆神经网络〜（INN）之类的生成网络实现了概率展开，该网络将单个事件映射到其相应的展开的概率分布 ...

0 0 0 2025/06/25 arXiv:2212.08674v3 RRdec

Ragas: Automated Evaluation of Retrieval Augmented Generation

我们引入了RAGA（检索增强生成评估），这是一个用于检索增强生成（RAG）管道的无参考评估的框架。RAG系统由检索和基于LLM的生成模块组成，并为LLM提供来自参考文本数据库的知识，这使他们能够充当用户和文本数据库之间的自然语言层，从而降低产生幻觉的风险。然而，评估RAG架构具有满足性，因为有几个维度需要考虑：检索系统识别相关和重点上下文论文能力、LLM以可靠的方式利用这些段落的能力，或者生成本身 ...

0 0 0 2025/06/25 arXiv:2309.15217v2 XiaoGuo_LU

From Crowdsourced Data to High-Quality Benchmarks: Arena-Hard and BenchBuilder Pipeline

语言模型的快速发展需要开发更具挑战性的基准。当前的静态基准通常难以一致地区分不同模型的功能，并且无法与现实世界的用户偏好保持一致。另一方面，像 Chatbot Arena 这样的实时众包平台会收集广泛的自然提示和用户反馈 ...

0 0 0 2025/06/25 arXiv:2406.11939v2 XiaoGuo_LU

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）