大型语言模型(LLM)代理通常采用逐步推理框架,在该框架中,他们交织了思考和行动以完成给定任务的过程。但是,该范式面临着根深蒂固的一通问题,每个产生的中间思想都会插入轨迹中,无论其正确性如何,这可能会导致不可逆的错误传播。为了解决这个问题,本文提出了一个新颖的框架,称为“发电机辅助逐步回滚”(GA-ROLLBACK),以诱导LLM代理的更好决策 ...
0 0 0 2025/05/21 arXiv:2503.02519v2 RAINY
当通过大型语言模型(LLM)增强的多代理系统在集体智能中具有深远的能力。但是,出于恶意目的,这种情报的潜在滥用带来了重大风险。迄今为止,关于与多代理系统相关的安全问题的全面研究仍然有限 ...
0 0 0 2025/05/21 arXiv:2401.11880v3 tmylla
我们介绍了Nocturne,这是一种新的2D驾驶模拟器,用于研究部分可观察性下的多代理协调。夜曲的重点是在现实世界多代理设置中对推理和心理理论进行研究,而没有计算机视觉的计算开销并从图像中提取特征。该模拟器中的代理只会观察到场景的障碍,模仿人类的视觉传感限制 ...
0 0 0 2025/05/21 arXiv:2206.09889v3 chenlei
本文提出了一种新颖的风险敏感贸易代理,结合了加强学习和大型语言模型(LLMS)。我们通过添加风险评估和交易推荐信号来扩展有条件的风险近端政策优化(CPPO)算法。使用FNSPID数据集中的财务新闻数据和DeepSeek V3,QWEN 2,我们在NASDAQ-100指数基准测试中进行了重测测试 ...
0 0 0 2025/05/21 arXiv:2502.07393v1 Hahhhnxsm
使用大型语言模型(LLMS)提供动力的代理商的社会,在解决问题的自动化问题中取得了重大进展。在金融中,努力主要集中在单独的系统上处理特定任务或独立收集数据的多代理框架。但是,多代理系统复制现实世界贸易公司的协作动态的潜力仍然没有得到充实 ...
0 0 0 2025/05/21 arXiv:2412.20138v6 Hahhhnxsm
收债协商(DCN)对于管理不表现贷款(NPL)和减少债权人损失至关重要。传统方法是劳动密集型的,而大型语言模型(LLMS)具有有希望的自动化潜力。但是,先前的系统缺乏动态的谈判和实时决策能力 ...
0 0 0 2025/05/21 arXiv:2502.18228v1 terry.yide
我们介绍了代理推理,该框架通过整合使用外部工具的代理来增强大型语言模型(LLM)推理。与传统的基于LLM的推理方法不同,这些方法仅依赖于内部推理,代理推理动态参与Web搜索,代码执行和结构化的推理 - 上下文内存,以解决需要深入研究和多步逻辑扣除的复杂问题。我们的框架介绍了思维地图代理,该框架构建了一个结构化的知识图来跟踪逻辑关系,从而改善了演绎推理 ...
0 0 0 2025/05/21 arXiv:2502.04644v1 smarto
基于大语言模型(LLM)的智能代理系统在现实世界应用中显示出巨大的潜力。但是,现有的代理框架仍然面临任务计划和执行的关键限制,从而限制了其有效性和可推广性。具体而言,当前的计划方法通常缺乏明确的全球目标,导致代理人陷入本地分支机构或制定不可执行的计划 ...
0 0 0 2025/05/21 arXiv:2504.16563v3 Flyer-Jia

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)