一译 —— 文档和论文翻译、对照阅读、讨论和社区

Towards Event Extraction with Massive Types: LLM-based Collaborative Annotation and Partitioning Extraction

在事件提取（EE）中，开发一种可以提取大量类型的事件的通用提取系统（EE）是一个长期存在的目标。在这样做的过程中，挑战来自两个方面：1）缺乏有效的注释方法。 2）缺乏强大的提取方法可以处理大量类型 ...

0 0 0 2025/09/29 arXiv:2503.02628v1 xuexizhanghao

Bayesian Deep Learning and a Probabilistic Perspective of Generalization

贝叶斯方法的关键区别特性是边缘化，而不是使用单个权重。贝叶斯边缘化特别可以提高现代深神网络的准确性和校准，这些神经网络通常由数据指定，并且可以代表许多引人注目但不同的解决方案。我们表明，深度集合为近似贝叶斯边缘化提供了有效的机制，并提出了一种相关方法，该方法通过在吸引人的盆地内边缘化而没有明显的开销来进一步改善预测分布 ...

0 0 0 2025/09/29 arXiv:2002.08791v4 qq347164380

Answer, Refuse, or Guess? Investigating Risk-Aware Decision Making in Language Models

知道何时回答或拒绝对于安全可靠的决策语言推动者至关重要。尽管先前的工作已经引入了拒绝策略来提高LMS的可靠性，但这些模型如何使其决策适应不同的风险水平。我们将风险意识决策的任务正式化，暴露了现有LMS中的关键弱点，并提出了技能分类解决方案来减轻它们 ...

0 0 0 2025/09/29 arXiv:2503.01332v1 aaaa1

SAHM: State-Aware Heterogeneous Multicore for Single-Thread Performance

在现代处理器设计中，提高单线程的性能仍然是一个关键的挑战，因为传统的方法（例如更深入的猜测，更广泛的管道和复杂的阶外执行）面部的收益减少。这项工作介绍了SAHM  - 状态感知的异质性多重点 - 一种新颖的架构，该架构通过利用单线读取工作负载中的细粒度，时变的行为多样性来针对性能提高。通过对绩效计数器数据的经验表征，我们定义了16个不同的行为状态，代表不同的微体系构造需求 ...

0 0 0 2025/09/29 arXiv:2509.22405v1 jane88

Optimus-3: Towards Generalist Multimodal Minecraft Agents with Scalable Task Experts

最近，基于多模式大语言模型（MLLM）的代理在各个领域取得了显着的进步。但是，在诸如Minecraft之类的开放世界环境中，建立具有感知，计划，行动，基础和反思等能力的通才代理人仍然是挑战：特定于领域的数据，异质任务之间的干扰以及开放世界环境中的视觉多样性。在本文中，我们通过三个关键贡献解决了这些挑战 ...

0 0 0 2025/09/29 arXiv:2506.10357v1 plum

FamilyTool: A Multi-hop Personalized Tool Use Benchmark

通过利用外部工具来处理复杂任务的功能，将工具学习与大语言模型（LLMS）的集成在一起。但是，工具学习的现有基准不足解决了关键的现实个性化场景，尤其是那些在动态环境中需要多跳推理和诱导知识适应的基准。为了弥合这一差距，我们介绍了FamilyTool，这是一种基于家庭知识图（KG）的小型基准，该基准模拟了个性化的多跳工具使用方案 ...

0 0 0 2025/09/29 arXiv:2504.06766v2 sadbb

Tackling the Noisy Elephant in the Room: Label Noise-robust Out-of-Distribution Detection via Loss Correction and Low-rank Decomposition

强大的分布（OOD）检测是现代人工智能（AI）系统的必不可少的组成部分，尤其是在安全至关重要的应用中，模型必须从训练期间看不到的陌生类别中的输入。尽管在机器学习文献（以及基于事后的方法和基于培训的方法）中，在嘈杂的培训标签下进行了有效性，但在机器学习文献中进行了广泛的研究。最近的研究表明，标签噪声可以大大降低OOD的性能，但缺乏针对该问题的原则解决方案 ...

0 0 0 2025/09/29 arXiv:2509.06918v1 cuirun

AUV: Teaching Audio Universal Vector Quantization with Single Nested Codebook

我们建议使用单个代码手册AUV，这是一种统一的神经音频编解码器，可以进行良好的语音重建，并进一步扩展到一般音频，包括声音，音乐和声音。 AUV能够以比特率约为700 bps的比特率来解决任何16 kHz混合域音频部分。为了实现这一目标，我们将指导Matryoshka Codebook，其中包括嵌套域特定的分区，并通过相应的教师模型分配了进行蒸馏的相应模型 ...

0 0 0 2025/09/29 arXiv:2509.21968v1 13724122396

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）