过程监督,即评估每个步骤,对于复杂的大语言模型(LLM)推理和测试时间搜索至关重要 ...
0 0 0 2025/03/23 arXiv:2503.04618v1 cocoyo
文档是视觉丰富的结构,通过文本以及表格、图形、页面布局或字体传达信息。虽然现代文档检索系统在查询到文本匹配方面表现出强大的性能,但它们很难有效地利用视觉线索,从而阻碍了它们在检索增强生成等实际文档检索应用程序中的性能。为了对当前系统的视觉丰富文档检索进行基准测试,我们引入了视觉文档检索基准 ViDoRe,它由跨越多个领域、语言和设置的各种页面级检索任务组成 ...
0 0 0 2025/03/23 arXiv:2407.01449v6 arthur
内部文化学习(ICL)已将大型语言模型(LLMS)用于NLP任务的使用,从而通过在没有填充的标签示例上进行调节,从而实现了很少的学习。尽管有效率,ICL还是很容易出现错误,尤其是对于具有挑战性的例子。为了提高ICL的性能,我们提出了纠正性的内在学习(CICL),这种方法将模型的错误预测与地面真理校正伴随的方法结合到了提示中,旨在通过自我纠正提高分类准确性 ...
0 0 0 2025/03/23 arXiv:2503.16022v1 Jooooe
随着大语言模型(LLM)的快速发展,基于LLM的代理在各个领域被广泛采用,这对于自主决策和互动任务至关重要。但是,当前的工作通常依赖于适用于Vanilla LLM的及时设计或微调策略,这通常会导致在复杂的代理相关环境中的有效性或次优性能。尽管LLM优化技术可以改善许多一般任务中的模型性能,但它们缺乏针对关键代理功能的专门优化,例如长期计划,动态环境互动和复杂的决策 ...
0 0 0 2025/03/23 arXiv:2503.12434v1 xiximayou
随着大语言模型(LLM)的快速发展,基于LLM的代理和多代理系统(MAS)显着扩大了LLM生态系统的能力。这种演变源于通过内存,工具,环境甚至其他代理等其他模块赋予LLM的能力。但是,这一进步还引入了更复杂的可信度问题,以前的研究仅针对LLMS无法涵盖 ...
0 0 0 2025/03/23 arXiv:2503.09648v1 xiximayou
llm在他们的回答中体现不同角色的能力,例如“你是尤达”这样的提示。解释相对论。虽然这种能力允许llm的个性化并实现人类行为模拟,llm能力的影响仍不清楚... ...
0 0 0 2025/03/23 arXiv:2311.04892v2 billlight114
尽管文本到图像生成(T2I)的进步,但先前的方法通常会面临文本图像错位问题,例如生成的图像中的关系混乱。现有的解决方案涉及交叉注意操作,以更好地理解或整合大型语言模型以改善布局计划。但是,T2I模型的固有对齐功能仍然不足 ...
0 0 0 2025/03/23 arXiv:2403.04321v2 hei1046
用户喜欢在在线社区中分享“笔记”,包括他们的经历。因此,推荐符合用户兴趣的笔记就成为关键的任务。现有的在线方法仅将注释输入到基于伯特的模型中,以生成注释嵌入来评估相似性... ... ...
0 1 24 2025/03/23 arXiv:2403.01744v2 jecc

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)