一译 —— 文档和论文翻译、对照阅读、讨论和社区

State Tuning: State-based Test-Time Scaling on RWKV-7

测试时间缩放已成为机器学习中的重要研究方向，使模型能够增强其在此HTTP URL期间的表现能力，以在效率和表现力之间取得了微妙的平衡而闻名，从而从测试时间扩展技术中受益，从而利用了该扩展的键值（kV）来提高该型号的状态，从而使该型号的量表置于该量表，以供您介绍该量表。根据基于RNN的RWKV-7量身定制的Tuning此HTTP URL利用了RWKV-7的独特优势，我们的方法在目标任务上实现了最新的 ...

0 0 0 2025/06/11 arXiv:2504.05097v1 wonders

EcomScriptBench: A Multi-task Benchmark for E-commerce Script Planning via Step-wise Intention-Driven Product Association

人类通常使用面向目标的脚本计划，或者将连贯的行动序列朝特定目标设计为特定目标的能力。在电子商务中，客户越来越多地寻求基于LLM的助手来生成脚本并在每个步骤推荐产品，从而促进了方便有效的购物体验。但是，由于几个挑战，该功能仍然没有得到充实的态度，包括LLMS无法同时进行脚本计划和产品检索，在计划中的语义差异和搜索查询之间造成的匹配产品中的困难以及缺乏方法和缺乏方法和基准数据进行评估 ...

0 0 0 2025/06/11 arXiv:2505.15196v1 煎bingo仔

HydraInfer: Hybrid Disaggregated Scheduling for Multimodal Large Language Model Serving

多模式的大语言模型（MLLM）一直在迅速发展，从而实现了跨模式的理解和产生，并将人工智能推向了人工通用智能。但是，现有的MLLM推理系统通常是基于语言模型的架构设计，将图像处理和语言处理作为单个调度单元进行集成。在计算资源，内存访问模式和服务级别的目标（SLO）方面，这种设计努力满足不同阶段的异质需求，导致资源利用率较低和高请求延迟，最终无法满足各种推论方案的服务要求 ...

0 0 0 2025/06/11 arXiv:2505.12658v1 remaper

Intuitionistic Fuzzy Sets for Large Language Model Data Annotation: A Novel Approach to Side-by-Side Preference Labeling

人类偏好数据的质量对于培训和评估大型语言模型（LLM）至关重要，尤其是在从人类反馈（RLHF）和直接偏好优化（DPO）方案中学习的强化学习中。传统的并排（SBS）注释方法通常会在固有的不确定性，注释者分歧和偏好判断的复杂性上挣扎。本文介绍了一个基于直觉模糊集（IFS）的新框架，用于建模和汇总LLM数据注释任务中的人类偏好 ...

0 0 0 2025/06/11 arXiv:2505.24199v1 liuweitang

TongUI: Building Generalized GUI Agents by Learning from Multimodal Web Tutorials

构建图形用户界面（GUI）代理是一个有前途的研究方向，它模拟了与计算机或手机的人类互动以执行各种GUI任务。但是，开发广义GUI代理的主要挑战是在各种操作系统和应用程序中缺乏足够的轨迹数据，这主要是由于手动注释的高成本。在本文中，我们提出了TONGUI框架，该框架通过从丰富的多模式Web教程中学习来建立广义的GUI代理 ...

0 2 0 2025/06/11 arXiv:2504.12679v2 steven_adam

Optimizing Recall or Relevance? A Multi-Task Multi-Head Approach for Item-to-Item Retrieval in Recommendation

项目到项目（I2i）检索的任务是根据给定的触发物品确定一组相关且高度引人入胜的项目。这是现代推荐系统中的关键组成部分，用户先前参与的项目用作触发物品，以检索相关内容以供将来参与。但是，行业中现有的I2I检索模型主要建立在共同参与数据上，并使用召回措施进行了优化，该措施过于强调共同参与模式，而未能捕获语义相关性 ...

0 0 0 2025/06/11 arXiv:2506.06239v1 buzz

An Introduction to Double/Debiased Machine Learning

本文提供了对双重/辩护机器学习（DML）的实用介绍。 DML提供了在存在滋扰参数的情况下对目标参数进行推断的一般方法。 DML的目的是减少滋扰参数估计对目标参数估计值的影响 ...

0 0 0 2025/06/11 arXiv:2504.08324v1 vanishedzhou

On generating direct powers of dynamical Lie algebras

参数化量子电路的表现性和训练性已显示与它们相关的动态谎言代数（DLA）密切相关。从量子算法设计的角度来看，给定了一个$ a $ a $ a $ a $ a $ a $ a dla发电机，出现了两个自然问题：（i）什么是$ {a} $生成的dla $ \ mathfrak {g} _ {a} $; （ii）修改发电机集如何导致所得DLA的变化。虽然第一个问题是引起重大关注的主题，但第二个问题的做法却 ...

0 0 0 2025/06/11 arXiv:2506.05733v1 oracle

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）