tangemon的文档

tangemon

个性签名 ...

A Survey on the Memory Mechanism of Large Language Model based Agents

基于大语言模型（LLM）的代理最近引起了研究界和工业界的广泛关注。与原始LLM相比，基于LLM的智能体具有自我进化能力，这是解决需要长期且复杂的智能体与环境交互的现实问题的基础。支持智能体与环境交互的关键组件是智能体的记忆 ...

0 0 0 0 2024/04/26 arXiv:2404.13501v1 tangemon

"My agent understands me better": Integrating Dynamic Human-like Memory Recall and Consolidation in LLM-Based Agents

在这项研究中，我们提出了一种新颖的类人记忆架构，旨在增强基于大型语言模型的对话代理的认知能力。我们提出的架构使代理能够自主回忆生成响应所需的记忆，有效解决 LLM 时间认知的限制。我们采用人类记忆线索回忆作为准确有效的记忆回忆的触发因素 ...

0 0 0 0 2024/04/17 arXiv:2404.00573v1 tangemon

A hybrid LLM workflow can help identify user privilege related variables in programs of any size

许多程序涉及操纵用户权限的操作和逻辑，这对于组织的安全至关重要。因此，攻击者常见的恶意目标之一就是获取或提升权限，造成权限泄露。为了保护程序和组织免受特权泄漏攻击，消除可被利用来实现此类攻击的漏洞非常重要 ...

0 0 0 0 2024/04/17 arXiv:2403.15723v1 tangemon

VideoAgent: A Memory-augmented Multimodal Agent for Video Understanding

我们探索如何将多个基础模型（大型语言模型和视觉语言模型）与新颖的统一记忆机制相协调来解决具有挑战性的视频理解问题，特别是捕获长视频中的长期时间关系。特别是，所提出的多模态代理 VideoAgent： 1）构造一个结构化存储器来存储视频的通用时间事件描述和以对象为中心的跟踪状态； 2）给定一个输入任务查询，它利用包括视频片段定位和对象内存查询在内的工具以及其他视觉基础模型来交互式地解决任务，利用 LLM 的零样本工具使用能力。 VideoAgent 在多个长视野视频理解基准测试中表现出了令人印象深刻的性能，平均提高了 6 分 ...

0 0 0 0 2024/04/17 arXiv:2403.11481v1 tangemon

Couler: Unified Machine Learning Workflow Optimization in Cloud

机器学习 (ML) 已变得无处不在，推动了各个组织中数据驱动的应用程序的发展。与研究中 ML 的传统认知相反，ML 工作流程可能很复杂、资源密集型且耗时。扩展机器学习工作流程以涵盖更广泛的数据基础设施和数据类型可能会导致更大的工作负载和增加的部署成本 ...

0 0 0 0 2024/04/16 arXiv:2403.07608v1 tangemon

Cognitive Architectures for Language Agents

最近的努力通过外部资源（例如互联网）或内部控制流（例如网络）增强了大型语言模型（LLM） ...

0 0 0 0 2024/04/16 arXiv:2309.02427v3 tangemon

Think-in-Memory: Recalling and Post-thinking Enable LLMs with Long-Term Memory

记忆增强大型语言模型（LLM）在长期人机交互中表现出了卓越的性能，其基本上依赖于历史的迭代回忆和推理来生成高质量的响应。然而，这种重复的回忆推理步骤很容易产生有偏见的想法，\textit{i.e. ...

0 0 0 0 2024/04/12 arXiv:2311.08719v1 tangemon

ExpeL: LLM Agents Are Experiential Learners

最近，通过利用 LLM 中嵌入的广泛的世界知识，将大型语言模型 (LLM) 应用于决策任务的研究兴趣激增。虽然针对定制决策任务定制 LLM 的需求不断增长，但针对特定任务对其进行微调需要大量资源，并且可能会降低模型的泛化能力。此外，GPT-4 和 Claude 等最先进的语言模型主要可通过 API 调用访问，其参数权重仍然是专有的，不对公众开放 ...

0 0 0 0 2024/04/12 arXiv:2308.10144v2 tangemon

MemoChat: Tuning LLMs to Use Memos for Consistent Long-Range Open-Domain Conversation

我们提出了 MemoChat，这是一种用于细化指令的管道，使大型语言模型 (LLM) 能够有效地使用自行撰写的备忘录来维持一致的远程开放域对话。我们通过迭代的“记忆-检索-响应”循环演示了远程开放域对话。这需要我们为每个不同阶段精心设计量身定制的调优指令 ...

0 0 0 0 2024/04/11 arXiv:2308.08239v2 tangemon

MoT: Memory-of-Thought Enables ChatGPT to Self-Improve

大型语言模型（LLM）在各种任务中表现出了令人印象深刻的能力。然而，从根本上改进它们取决于高质量的数据集或计算成本高昂的微调。相反，人类可以通过自我思考和记忆轻松地提高自己，而不需要外部资源 ...

0 0 0 0 2024/04/11 arXiv:2305.05181v2 tangemon