一译 —— 文档和论文翻译、对照阅读、讨论和社区

Graph-R1: Towards Agentic GraphRAG Framework via End-to-end Reinforcement Learning

检索增强的一代（RAG）通过合并外部知识来减轻LLM中的幻觉，但依赖于缺乏结构语义的基于块的检索。 GraphRag方法通过将知识作为实体关联图建模来改善抹布，但仍面临高建筑成本，固定的一次性检索以及对长篇文化推理和及时设计的依赖的挑战。为了应对这些挑战，我们建议通过端到端强化学习（RL）的Graph-R1（Agrage-R1） ...

0 0 0 2025/09/12 arXiv:2507.21892v1 liangliangliang

Graph Reinforcement Learning Application to Co-operative Decision-Making in Mixed Autonomy Traffic: Framework, Survey, and Challenges

连接和自动化车辆（CAV）的正确运行对于未来智能运输系统的安全性和效率至关重要。同时，过渡到完全自主驾驶需要长时间的混合自主流量，包括骑士和人类驱动的车辆。因此，为骑士的协作决策对于产生适当的驾驶行为至关重要，以提高混合自主流量的安全性和效率 ...

0 0 0 2025/09/12 arXiv:2211.03005v1 zweq

DORNet: A Degradation Oriented and Regularized Network for Blind Depth Super-Resolution

在固定和已知降解的假设（例如，双子型下采样）的假设下，最近的RGB引导深度超分辨率方法已实现了令人印象深刻的性能 ...

0 0 0 2025/09/12 arXiv:2410.11666v4 oldwound

An Empirical Study of Vulnerable Package Dependencies in LLM Repositories

近年来，大型语言模型（LLM）发展迅速，彻底改变了各个领域。尽管他们取得了广泛的成功，但LLMS很大程度上依赖包装管理系统的外部代码依赖性，创建了一个复杂且相互联系的LLM依赖供应链。依赖项的漏洞可以使LLMS暴露于安全风险 ...

0 0 0 2025/09/12 arXiv:2508.21417v1 ctf101

Emergent Hierarchical Reasoning in LLMs through Reinforcement Learning

强化学习（RL）已被证明在增强大语言模型（LLM）的复杂推理能力方面非常有效，但推动这一成功的基本机制仍然很大程度上不透明。我们的分析表明，像``啊哈时刻''一样令人困惑的现象，``长度缩放''和熵动态不是截然不同的事件，而是出现的紧急推理层次结构的标志，类似于分离高级战略计划，从人类的认知中脱颖而出。提高其低级技能 ...

0 0 0 2025/09/12 arXiv:2509.03646v2 3307915720

FedMUA: Exploring the Vulnerabilities of Federated Learning to Malicious Unlearning Attacks

最近，在联邦学习中``被遗忘的权利''的实际需求产生了一种称为联邦未来学习的范式，这使服务器能够在客户端的删除请求时忘记个人数据。现有的关于联邦学习的研究主要集中于有效地消除客户模型中所请求的数据的影响而不从头开始重新审议，但是，他们很少怀疑其在未学习前后的预测性能之间的差异所带来的全球模型的可靠性。为了弥合这一差距，我们迈出了第一步，引入了一种新颖的恶意攻击，称为Fedmua，旨在揭示在未学习过 ...

0 0 0 2025/09/12 arXiv:2501.11848v1 ShiningReei

Improving Synthetic Image Detection Towards Generalization: An Image Transformation Perspective

借助最近促进照片现实图像综合的生成模型，合成图像的扩散也对社交平台产生了某些负面影响，从而提出了开发有效探测器的紧急情况。当前的合成图像检测（SID）管道主要致力于制定通用伪影特征，并伴随着有关SID训练范式的监督。在本文中，我们重新检查了SID问题，并确定了当前训练范式中的两个普遍偏见，即 ...

0 0 0 2025/09/12 arXiv:2408.06741v2 sun.jiping

DATE: Dynamic Absolute Time Enhancement for Long Video Understanding

长期的视频理解仍然是多模式大语言模型（MLLM）的基本挑战，尤其是在需要精确的时间推理和事件本地化的任务中。现有方法通常采用统一的框架采样，并依靠隐式位置编码来建模时间顺序。但是，这些方法在远程依赖方面遇到了困难，导致关键的信息丢失并降低时间理解 ...

0 0 0 2025/09/12 arXiv:2509.09263v1 麦兜

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）