尽管大型语言模型(LLM)代理可以有效地使用外部工具来进行复杂的现实世界任务,但它们需要内存系统来利用历史体验。当前的内存系统启用基本存储和检索,但尽管最近尝试合并图形数据库,但仍缺乏复杂的内存组织。此外,这些系统的固定操作和结构限制了它们在各种任务中的适应性 ...
0 0 0 2025/06/03 arXiv:2502.12110v8 yli
会话助理通常需要一个问题重写算法,该算法利用过去的交互作用来为用户的问题或请求提供更有意义的(准确)答案。但是,确切的重写方法通常取决于对话助手支持的用例和特定于应用程序的任务以及其他约束。在本文中,我们在两个根本不同的生成任务上,系统地研究了两种不同的方法,称为重写和融合,包括文本到文本生成任务和多模式生成任务,该任务将作为输入文本并生成可视化或数据表,以回答用户的问题 ...
0 0 0 2025/06/03 arXiv:2502.18860v2 liuweitang
基于自主LLM的代理已经成为复杂任务执行的强大范式,但该领域缺乏用于开发,部署,分发和发现代理的标准化工具。我们提出了Cerebrum,这是AIO的代理SDK,它通过三个关键组件解决此差距:(1)综合SDK,具有用于代理开发的模块化四层体系结构,用于代理开发,涵盖LLM,内存,存储,存储和工具管理; (2)由社区驱动的代理集线器共享和发现代理,并配有版本控制和依赖性管理; (3)用于测试和评估代理 ...
0 0 0 2025/06/03 arXiv:2503.11444v1 yli
法律通过检索(LPR)系统至关重要,因为它们可以帮助从业者节省起草法律论点时的时间。但是,它仍然是一个毫无疑问的大道。一个主要原因之一是查询与目标通过之间的显着词汇不匹配 ...
0 0 0 2025/06/03 arXiv:2505.12950v1 liuweitang
尽管经营链(COT)在增强大语言模型(LLM)的推理能力方面取得了巨大的成功,但COT的机制仍然是``黑匣子''。即使经常获得正确的答案,现有的COT也很难使人类可以理解的推理。在本文中,我们从因果关系的角度提出和因果关系,以确保所有推理步骤的正确性和可理解性(据我们所知,首先是这样) ...
0 0 0 2025/06/03 arXiv:2502.18239v1 杨十七
个性化的图像生成旨在产生用户指定概念的图像,同时启用灵活的编辑。最近的无培训方法比基于培训的方法具有更高的计算效率,但仍与身份保存,适用性和与扩散 Transformer (DITS)相容。在本文中,我们揭示了DIT的未开发潜力,在这些潜力中,简单地用参考主题的 Token 替换了 Token ,从而实现了零拍的主题重建 ...
0 0 0 2025/06/03 arXiv:2503.12590v1 assvga
深度换脸的泛滥对我们的日常生活造成了巨大的潜在负面影响。尽管这些年来深度伪造检测取得了巨大进步,但针对来自未见过的数据集或新兴生成模型创建的伪造的现有方法的通用性仍然受到限制。在本文中,受视觉语言模型(VLM)零样本优势的启发,我们提出了一种新颖的方法,将训练有素的 VLM 重新用于一般的深度伪造检测 ...
0 0 0 2025/06/03 arXiv:2409.02664v4 13080420360
反事实解释(CE)技术引起了人们的关注,作为向与AI系统接触的用户提供见解的一种手段。虽然在医学成像和自动驾驶汽车等领域进行了广泛的研究,但图形反事实解释(GCE)方法的探索相对较小。 GCE生成了一个与原始图相似的新图,其结果基于基础预测模型 ...
0 0 0 2025/06/03 arXiv:2312.11747v2 Rimez

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)