大型语言模型(LLMS)已转换了代码生成,但是它们在硬件设计中的应用产生的门数为38 \%-1075 \%\%比人类设计高。我们提出了CircuitMind,这是一个多代理框架,通过三个关键创新来实现人类竞争效率:语法锁定(将生成限制为基本逻辑大门),检索授权的生成(启用知识驱动的设计)和双重奖励优化(与效率平衡正确)。为了评估我们的方法,我们介绍了TC-Bench,这是Turncomplete生 ...
0 0 0 2025/04/22 arXiv:2504.14625v1 jane88
大型语言模型(LLM)在代码生成中表现出强大的能力,强调了严格和全面评估的关键需求。现有的评估方法分为三类,包括以人为本,基于公制的和LLM。考虑到以人为本的方法是劳动密集型和基于指标的方法过于依赖参考答案,因此基于LLM的方法由于其更强的上下文理解能力和较高的效率而受到了越来越多的关注 ...
0 0 0 2025/04/22 arXiv:2504.13472v1 jokerdd
大型语言模型(LLM)代理正在迅速改进,以处理日益复杂的基于Web的任务。这些代理中的大多数都依靠通用,专有模型(例如GPT-4),并专注于设计更好的提示以提高其计划能力。但是,通用LLM并未经过专门培训以了解HTML等专业网络环境,并且他们经常在长马计划中挣扎 ...
0 0 0 2025/04/21 arXiv:2411.15004v2 panda__
通过将外部的,特定于域的数据纳入生成过程,检索增强的生成(RAG)通过将外部,特定领域的数据结合到生成过程来增强大型语言模型(LLMS)。尽管LLM具有很高的能力,但它们通常依赖于静态的,预训练的数据集,从而限制了它们集成动态或私人数据的能力。传统的抹布系统通常使用单格架构来处理查询生成,数据检索和响应综合 ...
0 0 0 2025/04/21 arXiv:2412.05838v1 Daisyhhh
个性化已成为现代AI系统中的重要能力,从而实现了与单个用户偏好,上下文和目标保持一致的自定义交互。最近的研究越来越集中于检索演出的生成(RAG)框架及其在个性化设置中基于高级代理的架构以增强用户满意度。在该基础的基础上,这项调查系统地检查了抹布的三个核心阶段的个性化:返回前,检索和一代 ...
0 0 0 2025/04/21 arXiv:2504.10147v1 zl1994
在人类机器人研究中,建立能够在现实世界中实现人类水平绩效的自主机器人代理是一个最终目标。最近的进步通过基础模型(FM)和人形机器人的低级技能开发在高级认知方面取得了重大进展。但是,直接结合这些组件通常会由于长途任务中的误差和不同模块的不同延迟而导致的鲁棒性和效率差 ...
0 0 0 2025/04/21 arXiv:2503.12533v1 WuYP
代码审核是一个代码审核过程,目的是查找错误。大型语言模型(LLMS)在此任务中显示出很大的潜力,它提供了分析程序而无需汇编并在指定的提示后启用自定义的错误检测的能力。但是,将LLMS应用于存储库级代码审核带来了显着的挑战 ...
0 0 0 2025/04/21 arXiv:2501.18160v2 jiang
新型小分子药物的发现仍然是一项关键的科学挑战,对治疗疾病和推动人类健康的影响深远。传统的药物开发 - 特别是对于小分子疗法 - 是一个高度复杂,资源密集且耗时的过程,需要多学科的合作。最近的人工智能(AI)的最新突破,尤其是大语言模型(LLM)的兴起,为简化和加速这一过程提供了变革性的机会 ...
0 0 0 2025/04/21 arXiv:2503.22164v2 chaojijiayou

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)