arxiv的文档

arxiv 南京

个性签名 ...

MCP-Zero: Active Tool Discovery for Autonomous LLM Agents

函数呼叫使大型语言模型（LLMS）能够充当使用工具的代理，但是将数千个工具模式注入提示是昂贵且容易出错的。我们介绍了MCP-Zero，这是一种主动的代理框架，使LLM本身可以决定何时以及要检索哪些外部工具，从而从头开始组装特定于任务的工具链。该框架建立在三个组件上：（1）主动工具请求，该模型在其中排放了结构化的$ \ left <\ operatatorName {tool \ _ assistant} \ right> $ block，该> $ block明确指定所需的服务器和任务；（2）层次矢量路由，这是一种首先选择候选服务器，然后根据语义相似性在每个服务器中对工具进行排名的粗略检索算法；（3）迭代主动调用，使多轮的跨域工具链构造具有最小的上下文开销，并允许在返回工具不足时迭代修改其请求 ...

0 0 0 0 2025/06/25 arXiv:2506.01056v4 JayLiu

Pantheon: Personalized Multi-objective Ensemble Sort via Iterative Pareto Policy Optimization

在本文中，我们提供了我们的里程碑合奏排序作品和第一手实践经验，Pantheon，它将合奏从“人类策划的艺术”转变为“机器优化的科学”。与基于配方的合奏排序相比，我们的万神殿具有以下优点：（1）个性化的联合培训：我们的万神殿是通过实时排名模型共同培训的，该模型可以准确地捕获不断变化的用户个性化兴趣。（2）表示继承：我们的万神殿不是高度压缩的PXTR，而是利用细颗粒的隐藏状态作为模型输入，这可以从排名模型中受益，以增强我们的模型复杂性 ...

0 0 0 0 2025/06/25 arXiv:2505.13894v1 buzz

WorldSense: Evaluating Real-world Omnimodal Understanding for Multimodal LLMs

我们介绍了Worldsense，这是第一个评估多模式视频理解的基准，该基准同时涵盖了视觉，音频和文本输入。与现有基准相反，我们的WorldSense具有多个功能：（i）Omni-Modosity的协作，我们设计了评估任务以具有强烈的音频和视频耦合，要求模型有效地利用Omni-Mododation的协同感知；（ii）视频和任务的多样性，WorldSense涵盖了1,662个音频视频的多样化集合，系统地分类为8个主要领域和67个细粒子类别，以涵盖广泛的方案，以及3,172个跨26个不同的QA Pairs，以遍及全面的评估；（iii）高质量的注释，所有质量检查对由80个具有多个校正的专家注释者手动标记，以确保质量。根据我们的世界义，我们广泛评估了各种最新模型 ...

0 0 0 0 2025/06/25 arXiv:2502.04326v2 zhangqi33

MCP-Zero: Active Tool Discovery for Autonomous LLM Agents

Pantheon: Personalized Multi-objective Ensemble Sort via Iterative Pareto Policy Optimization

WorldSense: Evaluating Real-world Omnimodal Understanding for Multimodal LLMs

LLM-MedQA: Enhancing Medical Question Answering through Case Studies in Large Language Models

Rectified Sparse Attention

USAD: Universal Speech and Audio Representation via Distillation

Omni-R1: Do You Really Need Audio to Fine-Tune Your Audio LLM?

Adversarial Learning Data Augmentation for Graph Contrastive Learning in Recommendation

X-Reasoner: Towards Generalizable Reasoning Across Modalities and Domains

Embodied Agent Interface: Benchmarking LLMs for Embodied Decision Making

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您在阅读时勇敢地改正翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）