一译 —— 文档和论文翻译、对照阅读、讨论和社区

ChineseEcomQA: A Scalable E-commerce Concept Evaluation Benchmark for Large Language Models

随着在电子商务等领域中大型语言模型（LLM）的使用越来越多，特定领域的概念评估基准对于评估其域功能至关重要。现有的LLM可能会在复杂的电子商务应用程序中生成事实错误的信息。因此，有必要建立电子商务概念基准 ...

0 0 0 2025/05/14 arXiv:2502.20196v1 la99

What Makes a Good Diffusion Planner for Decision Making?

扩散模型最近在解决决策问题方面表现出了巨大的潜力，尤其是在生成行为计划（也称为扩散计划）方面。尽管许多研究表明了扩散计划的令人印象深刻的表现，但良好扩散计划者的关键组成部分背后的机制尚不清楚，并且在现有研究中，设计选择非常不一致。在这项工作中，我们通过在离线增强学习（RL）设置中进行的系统经验实验来解决这个问题，从而提供了对扩散计划的基本组成部分的实用见解 ...

0 0 0 2025/05/14 arXiv:2503.00535v1 chenlei

Matrix Calculus (for Machine Learning and Beyond)

本课程是针对熟悉基本演算和线性代数的本科生的课程，将差分划分的延伸到更通用的矢量空间上的函数中，例如将矩阵输入矩阵并返回矩阵逆或分解的函数，并返回矩阵逆或分解，iDode solutions的衍生剂，甚至是随机函数的衍生剂，甚至是随机函数的衍生物。它强调了实用的计算应用，例如大规模优化和机器学习，必须重新构想衍生物才能通过复杂的计算来传播。该课程还讨论了导致“伴随”或“反向模式”分化的效率问题（a ...

0 0 0 2025/05/14 arXiv:2501.14787v1 SmartPig

Knowing You Don't Know: Learning When to Continue Search in Multi-round RAG through Self-Practicing

检索增强发电（RAG）在增强语言模型的知识和减少AI生成幻觉方面表现出很强的能力，从而推动了其广泛使用。但是，需要多轮检索的复杂任务仍然具有挑战性，而没有良好的自我怀疑主义感，早期尝试往往过于乐观。当前的多轮破布系统即使已经检索到足够的信息，也可能会继续进行搜索，或者它们在没有足够的信息或知识的情况下可能会提供错误的答案 ...

0 0 0 2025/05/14 arXiv:2505.02811v1 mike_zhang

UniMERNet: A Universal Network for Real-World Mathematical Expression Recognition

本文介绍了UNIMER数据集，标志着针对复杂现实世界情景的数学表达识别（MER）的首次研究。 UNIMER数据集包括一个大规模训练集，Unimer-1M，它提供了前所未有的规模和多样性，并通过一百万个培训实例来培训高质量，健壮的模型。此外，Unimer具有精心设计的，多样化的测试集，Unimer测试，涵盖了在现实世界情景中发现的各种公式分布，提供了更全面，更公平的评估 ...

0 0 0 2025/05/14 arXiv:2404.15254v2 kubileha

SimRAG: Self-Improving Retrieval-Augmented Generation for Adapting Large Language Models to Specialized Domains

检索增强生成（RAG）通过整合外部知识来增强大语言模型（LLM）的问答（QA）能力。然而，由于分布变化和对特定领域数据的访问有限，使通用 RAG 系统适应科学和医学等专业领域会带来独特的挑战。为了解决这个问题，我们提出了 SimRAG，这是一种自我训练方法，为 LLM 提供问答和问题生成的联合能力，以适应领域 ...

0 0 0 2025/05/14 arXiv:2410.17952v2 aulisa

One missing piece in Vision and Language: A Survey on Comics Understanding

视觉语言模型最近已演变为能够在各种任务中具有高性能的多功能系统，例如文档理解，视觉问题答案和接地，通常通常是在零拍设置中。漫画理解是一个复杂而多方面的领域，可以从这些进步中受益匪浅。漫画作为一种媒介，将丰富的视觉和文本叙述结合在一起，挑战AI模型以及涵盖图像分类，对象检测，实例细分以及通过顺序面板更深入的叙述理解的任务 ...

0 0 0 2025/05/14 arXiv:2409.09502v2 18232448525

1$^{st}$ Place Solution of WWW 2025 EReL@MIR Workshop Multimodal CTR Prediction Challenge

www 2025 EREL@mir Workshop多模式CTR预测挑战着重于有效地应用多模式嵌入功能，以提高建议系统中的点击率预测（CTR）预测。该技术报告介绍了我们的1 $^{st} $ place Winning解决方案，以结合顺序建模和功能交互学习，以有效地捕获用户项目的交互。对于多模式信息集成，我们只需将冷冻的多模式嵌入将其附加到每个项目的嵌入中即可 ...

0 0 0 2025/05/14 arXiv:2505.03543v1 ttwt

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）