遵循指令的能力对于大型语言模型 (LLM) 处理各种实际应用程序至关重要。现有的基准主要侧重于评估纯粹的响应质量,而不是评估响应是否遵循指令中规定的约束。为了填补这一研究空白,在本文中,我们提出了 FollowBench,一种适用于 LLM 的多级细粒度约束跟踪基准 ...
0 1 0 2025/06/26 arXiv:2310.20410v3 lalaxiao
大型视觉动作(VLA)模型显示出体现AI的显着潜力。但是,由于对分配变化的复合错误的敏感性,他们通过监督微调(SFT)限制了概括的主要培训。强化学习(RL)通过试用和错误为任务目标进行优化,为克服这些局限性提供了一条途径,但是与SFT相比,缺乏对VLA的特定概括益处的系统理解 ...
0 0 0 2025/06/26 arXiv:2505.19789v2 晚餐杀手
大型语言模型(LLMS)的最新进展已推动了自然语言界面的研究到数据库。但是,大多数最先进的文本到SQL系统仍然取决于复杂的多阶段管道。这项工作提出了一个新型的代理框架,该框架可以在单个端到端组件中统一链接,查询生成和迭代精致 ...
0 0 0 2025/06/26 arXiv:2506.01273v1 zkq
我们连续获取,组织和利用知识的能力是人类智能的关键特征,AI系统必须大约释放其全部潜力。鉴于大语言模型(LLMS)的持续学习挑战,检索声明的一代(RAG)已成为引入新信息的主要方式。但是,它对矢量检索的依赖阻碍了其模仿人类长期记忆的动态和相互联系的能力 ...
0 0 0 2025/06/26 arXiv:2502.14802v2 sally2016
3D Gaussian脱落(3DGS)及其后续作品仅限于特定的硬件设置,无论是仅在低成本或高端配置上。旨在减少3DGS内存使用方面的方法,可以对低成本的GPU进行渲染,但损害渲染质量,在高端GPU的情况下,该方法无法利用硬件功能。相反,增强渲染质量的方法需要具有大VRAM的高端GPU,这使得对于具有有限记忆容量的低端设备使此类方法不切实际 ...
0 0 0 2025/06/26 arXiv:2408.12894v2 18855807556
近年来,深度学习已成为心脏图像分割中使用最广泛的方法。在本文中,我们回顾了,我们回顾了,其中涵盖了常见的成像模式,其中涵盖了常见的成像模式,包括磁(mri)、计算机断层扫描(ct)和超声(us)以及感兴趣的主要解剖结构(US)以及感兴趣的主要解剖结构(心室、心房和血管)。此外,还包括公开可用的心脏图像数据集和代码存储库的摘要,为鼓励可重复的研究提供基础,为鼓励可重复的研究提供基础... ...
0 0 0 2025/06/26 arXiv:1911.03723v1 looking
域名系统(DNS)是Internet的关键组成部分。 DNS解析器充当DNS客户端和DNS名称服务器之间的缓存,是DNS基础架构的中心部分,对DNS的可伸缩性必不可少。但是,发现解析器漏洞并非平凡,现有工具无法很好地解决此问题 ...
0 0 0 2025/06/25 arXiv:2310.03202v1 Fun_James
基于大语言模型(LLM)的多机构系统(MAS)在解决问题解决方面具有巨大的潜力。但是,他们仍然面临低沟通效率和次优的任务绩效的重大挑战,这使得对代理商的沟通拓扑的仔细设计尤为重要。受到管理理论的启发,即经常会动态调整在高效团队中的角色,我们提出了代理商,该代理商通过优化通信图的邻接矩阵来识别冗余代理和跨不同通信的通信,并消除它们以提高 Token 效率和任务绩效 ...
0 0 0 2025/06/25 arXiv:2503.18891v1 1150501302

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)