代理系统的最新进展表明,在解决通用和高度复杂的任务方面具有显着的能力。但是,大多数当前模型都缺乏协调专用代理的机制,并且有限地推广到新的或不同领域的能力。为此,我们介绍了AgentorChestra,这是一种用于通用任务解决的层次多代理框架,将高级计划与模块化代理协作集成在一起 ...
0 0 0 2025/08/25 arXiv:2506.12508v3 boydfd
推荐系统利用交互历史来估计用户偏好,已在广泛的行业应用中得到大量使用。然而,由于固有的缺陷,静态推荐模型很难很好地回答两个重要问题:a(a)用户到底喜欢什么?(b)用户为什么喜欢某个项目?缺点是静态模型学习用户偏好的方式造成的,即... ...
0 0 0 2025/08/25 arXiv:2101.09459v7 yang1young
我们提出了Klear-Reasoner,这是一个具有较长推理能力的模型,在解决问题期间表现出了仔细的审议,并在多个基准测试中实现了出色的性能。尽管在当前社区中已经有许多与推理模型相关的出色作品,但由于培训细节的披露不完整,重现高性能推论模型仍然存在许多问题。该报告提供了对推理模型的深入分析,涵盖了从数据制备和长期经过经过经过经过经过经验的监督链监督的微调(长COT SFT)到加固学习(RL)的整个 ...
0 0 0 2025/08/25 arXiv:2508.07629v2 ymx
大型语言模型(LLMS)通过测试时间缩放方法(例如自遇到性能和多数投票)在推理任务方面表现出了巨大的潜力。但是,这种方法通常会导致准确性和高计算开销的回报降低。为了应对这些挑战,我们充满信心地介绍了深层思考(DeepConf),这是一种简单而强大的方法,可在测试时提高推理效率和性能 ...
0 0 0 2025/08/24 arXiv:2508.15260v1 quziyan
Longrope2是一种新颖的方法,它将预训练的大语言模型(LLM)的有效上下文窗口扩展到目标长度,同时保留在原始较短上下文窗口上的性能。这是通过三个贡献来实现的:(1)一个假设,即较高绳索维度的训练不足有助于在现有方法中观察到的持续分布(OOD)问题; (2)一种有效的绳索恢复算法,该算法采用以“针驱动”的困惑为指导的进化搜索来解决训练问题不足; (3)一种混合的上下文窗口训练方法,该方法微调型 ...
0 0 0 2025/08/24 arXiv:2502.20082v1 ymx
经济学家和计算机科学家的注意,股票市场的价格运动预测一直是一个经典而又具有挑战性的问题。近年来,图形神经网络通过对公司关系进行深入学习,从而大大改善了预测性能。但是,现有的关系图通常是由手工制作的人类标签或自然语言处理构建的,这些手法构成了资源大量要求和较低准确性 ...
0 0 0 2025/08/24 arXiv:2305.08740v1 打笨蛋
扩散模型因其产生不仅具有视觉吸引力而且具有高艺术质量的图像的能力而被认可。结果,已经提出了布局到图像(L2i)生成,以利用特定区域的位置和描述,以使其更加精确,可控制。但是,以前的方法主要集中于基于UNET的模型(e ...
0 1 0 2025/08/24 arXiv:2412.03859v3 yisinoya
近似计算是一种有前途的方法,以提高深度神经网络处理中计算中的计算(CIM)系统的效率。但是,传统的近似技术通常会显着取得高度的能量效率的准确性,并且无法减少主内存和CIM银行之间的数据传输,从而占据了电力消耗。本文介绍了一种新型的概率近似计算(PAC)方法,该方法利用统计技术来近似乘数和积累(MAC)操作,与现有方法相比,近似误差减少了4倍 ...
0 0 0 2025/08/24 arXiv:2408.16246v1 wangjun

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)