一译 —— 文档和论文翻译、对照阅读、讨论和社区

Extracting or Guessing? Improving Faithfulness of Event Temporal Relation Extraction

在本文中，我们试图从两个角度提高temprel提取模型的忠诚。第一个观点是根据上下文描述真正提取。为了实现这一目标，我们建议进行反事实分析，以减轻两种重要类型的训练偏见的影响：事件触发偏见和频繁的标签偏见 ...

0 0 0 2025/09/24 arXiv:2210.04992v2 munian

Getting Sick After Seeing a Doctor? Diagnosing and Mitigating Knowledge Conflicts in Event Temporal Reasoning

事件时间推理旨在确定叙事中两个或多个事件之间的时间关系。但是，当事件在上下文中的实际时间关系与模型所学的先验知识或偏见之间存在不匹配时，知识冲突就会发生冲突。在本文中，我们建议在使用偏见指标的时间推理中检测知识冲突的示例，其中包括事件关系以前的偏见，时态偏见，叙事偏见和依赖性偏见 ...

0 0 0 2025/09/24 arXiv:2305.14970v2 munian

Reinforcement Learning Friendly Vision-Language Model for Minecraft

AI研究界的基本任务之一是建立一个自主体现的代理，该代理可以在各种各样的任务中实现高级绩效。但是，为所有开放式任务获取或手动设计奖励是不现实的。在本文中，我们提出了一种新颖的跨模式对比度学习框架架构Clip4MC，旨在学习增强学习（RL）友好视觉模型（VLM），该模型（VLM）是开放式任务的内在奖励功能 ...

0 0 0 2025/09/24 arXiv:2303.10571v2 plum

MindBench: A Comprehensive Benchmark for Mind Map Structure Recognition and Analysis

多模式大语言模型（MLLM）在文档分析领域取得了重大进展。尽管如此，现有的基准通常只专注于提取文本和简单的布局信息，忽略了结构化文档（例如思维图和流程图）中元素之间的复杂交互。为了解决这个问题，我们介绍了名为Mindbench的新基准，该基准不仅包括精心构建的双语真实或合成图像，详细注释，评估指标和基线模型，而且还专门设计了五种结构化的理解和解析任务 ...

0 0 0 2025/09/24 arXiv:2407.02842v1 jifen240

RL-GPT: Integrating Reinforcement Learning and Code-as-policy

大型语言模型（LLMS）已经证明了通过编码来利用各种工具的熟练程度，但是它们在处理复杂的逻辑和精确控制方面面临限制。在具体的任务中，高级计划可以直接编码，而低级动作通常需要特定于任务的精炼，例如增强学习（RL）。为了无缝整合这两种模式，我们引入了一个两级分层框架RL-GPT，包括缓慢的代理和快速代理 ...

0 0 0 2025/09/24 arXiv:2402.19299v1 plum

Open-World Reinforcement Learning over Long Short-Term Imagination

在高维开放世界中培训视觉强化学习者提出了重大挑战。尽管各种基于模型的方法通过学习交互式世界模型提高了样本效率，但这些试剂通常是“短视”的，因为它们通常是在简短的想象体验片段上训练的。我们认为，开放世界决策的主要挑战是提高了广阔的州空间的勘探效率，尤其是在需要考虑长途回报的任务中 ...

0 0 0 2025/09/24 arXiv:2410.03618v2 plum

Modality-Balanced Learning for Multimedia Recommendation

已经提出了许多建议模型，以研究如何有效地将多模式内容信息纳入传统的协作过滤框架。多模式信息的使用有望提供更全面的信息并带来卓越的性能。但是，多种模态的整合通常会遇到模态不平衡问题：由于不同方式中的信息是不平衡的，因此在所有模态上优化相同的目标会导致弱模态较弱的融合率或较低的性能的弱态度问题 ...

0 0 0 2025/09/24 arXiv:2408.06360v1 15713628555

Estimating treatment effect heterogeneity in randomized program evaluation

当使用随机实验评估社会计划和医疗治疗的疗效时，仅估计的总体因果效应通常具有有限的价值，研究人员必须调查治疗何时进行和不起作用。实际上，治疗效应异质性的估计在（1）从大量可用治疗中选择最有效的治疗方面起着至关重要的作用，（（2）确定治疗的亚群有效或有害的亚群，（3）设计个性化的最佳治疗方案，（4）（4）对效果的存在或缺乏均一的范围的范围估计，并缺乏对效应的范围，以及（5）对范围进行了范围的估计，并估 ...

0 0 0 2025/09/23 arXiv:1305.5682v1 lee9470

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）