利用大语言模型(LLM)的自主决策能力(LLMS)在推理任务中表现出卓越的表现。尽管迭代或递归检索的生成(RAG)取得了成功,但在面对复杂的任务时,它们通常会被困在单个解决方案空间中。在本文中,我们提出了一种新颖的抹布中的思维模式,该模式将系统分析与有效的推理动作相结合,显着激活了内在的推理能力,并通过蒙特卡洛树搜索(MCT)(MCT)(称为airrag)扩大了特定任务的解决方案空间 ...
0 0 0 2025/09/25 arXiv:2501.10053v3 夏与凛冬
当前的开放域问答((ODQA)模型范例通常包含检索模块和阅读模块。给定输入问题,阅读模块从检索器检索到的相关段落中预测答案。最近提出的fusion-in-in-in-indecoder(fid)建立在预训练生成模型t5之上,在读取模块中实现了最先进的性能... ...
0 0 0 2025/09/25 arXiv:2110.04330v2 1437591651
深度学习已经实施了广泛的应用,并且近年来变得越来越受欢迎。多模式深度学习的目标是创建可以使用各种模式来处理和链接信息的模型。尽管为单峰学习做出了广泛的发展,但它仍然无法涵盖人类学习的所有方面 ...
0 0 0 2025/09/25 arXiv:2105.11087v1 瞢闇
本文重新考虑了$ \ textbf {l} $ oad的实现 -  $ \ textbf {b} $ alancing $ \ textbf {l} $ oss(lbl)训练混合物(MOES)型号时。具体来说,MOE的LBL定义为$ n_e \ sum_ {i = 1}^{n_e} f_i p_i $,其中$ n_e $是专家总数,$ f_i $表示所选择的专家$ i $的频率,$ p_i $表示 ...
0 0 1 2025/09/25 arXiv:2501.11873v2 qiuyu1996
跨新闻,法律,医学和科学领域的文本数据的快速增长正成为有效访问和理解大量内容的挑战。用户有效消费和提取有意义的信息越来越复杂。因此,增加了对摘要的需求 ...
0 0 0 2025/09/25 arXiv:2509.16539v1 zjwbr
基于仿真的数据合成已成为增强现实世界机器人操作的强大范式。但是,由于两个挑战,现有的合成数据集仍然不足以进行强大的双人操作:(1)缺乏用于新任务的高效,可扩展的数据生成方法,以及(2)未能捕获现实世界中复杂性的过度简化模拟环境。我们提出Robotwin 2 ...
0 0 0 2025/09/25 arXiv:2506.18088v2 chaihoa
图卷积网络在图形结构化数据上的半监督学习中获得了显着的成功。基于图的半佩斯学习的关键是捕获图形结构施加的节点上标签或特征的平滑度。以前的方法,光谱方法和空间方法致力于将图形卷积定义为相邻节点上的加权平均值,然后学习图形卷积内核,以利用平滑度来提高基于图的半固定学习的性能 ...
0 0 0 2025/09/25 arXiv:2007.16002v1 DamnMan
新兴的机器学习(ML)模型(例如,变形金刚)涉及记忆引脚绑定型矩阵向量(MV)计算中的计算 ...
0 0 0 2025/09/25 arXiv:2404.04708v1 wangjun

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)