与传统资产相比,加密货币投资本质上很困难,需要整合来自各种方式的大量数据以及对复杂推理的需求。尽管已经采用了深度学习方法来应对这些挑战,但它们的黑盒本质引起了人们对信任和解释性的关注。最近,大型语言模型(LLMS)由于能够理解多模式数据并产生可解释的决策,因此在财务应用中显示了希望 ...
0 0 0 2025/03/13 arXiv:2501.00826v2 75916747
尽管大语言模型(LLM)在各种推理任务中具有显着的功能,但它们仍然在表格推理任务上挣扎,尤其是在整个多步推理过程中保持一致性时。尽管现有方法探讨了各种分解策略,但它们通常缺乏有效的机制来识别和纠正中间推理步骤中的错误,从而导致级联错误传播。为了解决这些问题,我们提出了Table-Critic,这是一个新型的多代理框架,促进了对推理过程的协作批评和迭代性的完善,直到融合纠正解决方案为止 ...
0 0 0 2025/03/13 arXiv:2502.11799v1 格子
尽管MLLM表现出足够的图像理解能力,但他们仍然在像素级的理解力上挣扎,从而限制了其实际应用。当前的评估任务(例如VQA和视觉接地)仍然太粗糙,无法准确评估细粒的像素理解。尽管分割是用于像素级理解的基础,但现有方法通常需要MLLM来生成隐式 Token ,该 Token 通过外部像素解码器解码 ...
0 0 0 2025/03/13 arXiv:2503.08625v1 zed
大型语言模型(LLMS)在现有的医学提问基准测​​试中表现出令人印象深刻的表现。这种高性能使评估和区分先进方法变得越来越困难。我们提出了MedagentsBench,这是一个基准,该基准侧重于挑战医学问题,需要多步临床推理,诊断制定和治疗计划 - 赛季里奥斯,尽管它们在标准测试方面表现出色,但目前的模型仍在挣扎 ...
0 0 0 2025/03/12 arXiv:2503.07459v1 liuweitang
受人类认知双过程理论的启发,duma,这是一种新颖的对话代理框架,llm),来体现双重思维机制。快速思维模型充当外部交互和初始响应生成的主要界面 ...
0 0 0 2025/03/12 arXiv:2310.18075v4 liner
本文探讨了理解基于LLM的代理商的社会行为的开放研究问题。使用Avalon作为测试台,我们采用系统提示来指导游戏玩法中的LLM代理。虽然先前的研究已经与LLM代理商进行了游戏玩法,但缺乏对其社交行为的研究 ...
0 0 0 2025/03/12 arXiv:2310.14985v4 owenzds
机器翻译(mt)的最新进展显着提高了各个领域的翻译质量。然而,由于其复杂的语言、比喻表达和文化差异,文学文本的翻译仍然是一个艰巨的挑战。在这项工作中,llm)的文学翻译新颖的多代理框架 ...
0 0 0 2025/03/12 arXiv:2405.11804v1 JayLiu
使用大语言模型(LLM)代理的自动代码生成的最新进步使我们更加接近自动化软件开发的未来。但是,由于上下文长度的限制,现有的单个方法在生成和改善大规模,复杂的代码库方面面临限制。为了应对这一挑战,我们提出了自组织的多代理框架(SOA),这是一个新型的多代理框架,可实现大规模代码的可扩展生成和优化 ...
0 0 0 2025/03/12 arXiv:2404.02183v1 owenzds

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)