一译 —— 文档和论文翻译、对照阅读、讨论和社区

Hephaestus: Improving Fundamental Agent Capabilities of Large Language Models through Continual Pre-Training

由于面向代理的预训练数据缺乏，基于LLM的自主剂通常依赖于复杂的提示或广泛的微调，这通常无法引入新的功能，同时保持强大的可推广性。我们介绍了Hephaestus-Forge，这是第一个旨在增强LLM代理在API函数调用，内在推理和计划中以及适应环境反馈的大规模训练之前的大规模训练前语料库。 Hephaestus-Forge包括103B特定于特定于代理的数据，其中包括76,537个API，包括既有工 ...

0 0 0 2025/02/12 arXiv:2502.06589v1 mlp

Improving alignment of dialogue agents via targeted human judgements

我们推出了麻雀，一种信息寻求对话代理，经过训练，与提示语言模型基线相比，它更加有用、正确且无害。我们使用来自人类反馈的强化学习来训练我们的模型，并添加了两个新内容，以帮助人类评估者判断代理行为。首先，为了使我们的智能体更有帮助且无害，我们将良好对话的要求分解为智能体应遵循的自然语言规则，并分别向评估者询问每条规则... ...

0 0 0 2025/02/11 arXiv:2209.14375v1 Sydney

Bootstrapping Cognitive Agents with a Large Language Model

大型语言模型包含对世界的嘈杂知识，但很难训练或微调。另一方面，认知体系结构具有出色的解释性，并且可以灵活地进行更新，但需要大量的手动工作才能实例化。在这项工作中，我们结合了两全其美的最好的：引导基于认知的模型与大型语言模型中编码的嘈杂知识 ...

0 0 0 2025/02/11 arXiv:2403.00810v1 18636279200

LayoutCopilot: An LLM-powered Multi-agent Collaborative Framework for Interactive Analog Layout Design

模拟布局设计在很大程度上涉及人类与设计工具之间的互动过程。该任务的电子设计自动化（EDA）工具通常设计用于使用脚本命令或可视化按钮进行操作，尤其是用于交互式自动化功能，这些功能具有陡峭的学习曲线和繁琐的用户体验，为设计师采用而言是一个显着的障碍。为了解决此类可用性问题，本文介绍了LayoutCopilot，这是一个开拓性的多代理协作框架，由大型语言模型（LLMS）提供供您进行交互式模拟布局设计 . ...

0 0 0 2025/02/11 arXiv:2406.18873v3 royal

Plan-Then-Execute: An Empirical Study of User Trust and Team Performance When Using LLM Agents As A Daily Assistant

自从Chatgpt流行的爆炸爆发以来，大型语言模型（LLM）继续影响我们的日常生活。配备了用于特定目的的外部工具（例如 ...

0 0 0 2025/02/11 arXiv:2502.01390v1 royal

When AI Meets Finance (StockAgent): Large Language Model-based Stock Trading in Simulated Real-world Environments

AI代理可以模拟现实世界的交易环境来研究外部因素对股票交易活动的影响（例如，宏观经济学，政策变化，公司基本面和全球事件）？这些因素经常影响交易行为，是寻求最大化投资者利润的关键要素 ...

0 0 0 2025/02/10 arXiv:2407.18957v4 cr9294

A Survey on Large Language Model-based Agents for Statistics and Data Science

近年来，由大语言模型（LLMS）（称为“数据代理”）提供支持的数据科学代理人显示了转变传统数据分析范式的巨大潜力。这项调查概述了基于LLM的数据代理的演变，功能和应用，突出了它们在简化复杂数据任务并降低没有相关专业知识的用户的入口障碍中的作用。我们探讨了基于LLM的框架设计中的当前趋势，详细介绍了基本特征，例如计划，推理，反思，多机构协作，用户界面，知识集成和系统设计，这使代理可以解决以数据为中心 ...

0 0 0 2025/02/10 arXiv:2412.14222v1 Saros

RTBAgent: A LLM-based Agent System for Real-Time Bidding

实时竞标（RTB）使广告商可以立即就印象机会进行竞争性投标，并在竞争激烈的景观中努力争取成本效益。尽管RTB从深度学习和强化学习等技术的利用中受益匪浅，但相关方法的可靠性通常会由于在线和离线环境之间的差异以及在线竞标的迅速波动而遇到挑战。为了应对这些挑战，提议RTBAGENT作为基于大语言模型（LLMS）的第一个RTB代理系统，该系统同步了真正的竞争性广告招标环境，并通过集成的决策过程获得了竞标价 ...

0 0 0 2025/02/10 arXiv:2502.00792v1 wanghuiyong

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）