基于大型语言模型 (LLM) 的代理系统通常包含多个模型、复杂的工具调用和编排协议,其性能明显优于整体代理。然而,正是这种复杂性放大了它们的脆弱性,使它们更容易出现系统故障。查明在长执行跟踪中负责错误的特定代理或步骤定义了代理系统故障归因的任务 ...
0 0 0 2025/10/27 arXiv:2509.03312v2 dqyzhwk
对 LLM 的语言学评论深受索绪尔和乔姆斯基理论框架的影响,往往是推测性的且没有成果。批评者质疑 LLM 是否可以合法地建模语言,理由是需要“深层结构”或“基础”来实现理想化的语言“能力”。我们主张对维托尔德·曼恰克(Witold Manczak)的经验主义原则进行根本性的转变,维托尔德·曼恰克是一位著名的普通历史语言学家 ...
0 0 0 2025/10/27 arXiv:2510.12766v1 十门山几
人们已经研究了语言模型(LM)是否具有归纳偏差,偏向类型学上频繁的语法属性而不是罕见的、难以置信的语法属性,通常使用人工语言(AL)(White和Cotterell,2021;Kuribayashi等人,2024)。在本文中,我们从两个角度扩展了这些工作 ...
0 0 0 2025/10/27 arXiv:2510.12722v1 十门山几
元数据提取对于编目和保存数据集、实现有效的研究发现和可重复性至关重要,特别是考虑到当前科学研究的指数级增长。虽然 Masader(Alyafeai 等人,2021)为从阿拉伯 NLP 数据集的学术文章中提取广泛的元数据属性奠定了基础,但它在很大程度上依赖于手动注释 ...
0 0 0 2025/10/27 arXiv:2505.19800v2 wangluyi
分词器是最先进的生成图像模型的关键组成部分,它从信号中提取最重要的特征,同时减少数据维度和冗余。目前大多数分词器都基于 KL 正则化变分自动编码器 (KL-VAE),通过重建、感知和对抗损失进行训练。扩散解码器已被提出作为一种更有原则的替代方案,用于对以潜在条件为条件的图像分布进行建模 ...
0 0 0 2025/10/27 arXiv:2510.04961v1 wonders
我们引入了一种在学习的模拟模型中施加物理信息归纳偏差的方法。我们将图网络与可微常微分方程积分器结合起来作为预测未来状态的机制,并将哈密顿量作为内部表示。我们发现,我们的方法在预测准确性、能量准确性以及对训练期间未经历过的时间步长和积分器阶数的零样本泛化方面优于没有这些偏差的基线 ...
0 0 0 2025/10/27 arXiv:1909.12790v1 SummeRain
人工智能生成的内容技术广泛应用于内容创作。然而,当前的AIGC系统严重依赖创作者的灵感,很少生成真正的用户个性化内容。在在线广告等现实应用中,单个产品可能有多个卖点,不同的用户关注不同的功能 ...
0 0 0 2025/10/27 arXiv:2508.18118v1 bieshifu
最先进的顺序推荐在很大程度上依赖于基于自注意力的推荐模型。然而,此类模型的计算成本很高,而且对于实时推荐来说通常速度太慢。此外,自注意力操作是在序列级别执行的,从而使低成本增量推理变得具有挑战性 ...
0 0 0 2025/10/27 arXiv:2310.02367v2 siweima

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)