策略梯度方法是强化学习中一种有吸引力的方法,因为它们直接优化累积奖励,并且可以直接与神经网络等非线性函数逼近器一起使用。两个主要挑战是通常需要大量样本,以及尽管输入数据具有非平稳性但仍难以获得稳定和稳定的改进。我们通过使用价值函数来解决第一个挑战,以一些偏差为代价,大幅减少策略梯度估计的方差 ...
0 0 0 2025/09/16 arXiv:1506.02438v6 Cane_Wu
由于其长度,监管部分层次结构和特定领域的语言,诸如10-K申请之类的财务披露提出了挑战性的检索问题,这些语言标准了可检索的发电(RAG)模型。我们介绍指控(财务映射指导增强的答案检索),这是一个针对财务文件量身定制的检索框架。指尖结合了用于项目级指导的金融词典(FLAM),用于项目内搜索的双分层索引(摘要树和问题树),以及一个两阶段的跨编码器reranker ...
0 0 0 2025/09/16 arXiv:2509.12042v1 ellie
本文基于复杂价值的含义空间中语义吸引子的概念,为语义人工通用智能(AGI)开发了一个理论框架。偏离了基于统计的下一步预测的当前基于 Transformer 的语言模型,我们探索了一个模型,其中含义不是概率上推断出来的,而是通过递归张力转换形成的。使用涉及假想单元\ emph {i}的循环操作,我们描述了能够建模讽刺,同义词和歧义的旋转语义结构 ...
0 0 0 2025/09/16 arXiv:2508.18290v1 kkkk
目前,深度神经网络(DNN)广泛用于许多人工智能(AI)应用程序,包括计算机视觉,语音识别和机器人技术。尽管DNN在许多AI任务上提供了最先进的准确性,但它以高计算复杂性为代价。因此,在不牺牲应用程序准确性或增加硬件成本的情况下,可以有效地处理DNN的技术来提高能效和吞吐量,这对于AI系统中DNN的广泛部署至关重要 ...
0 0 0 2025/09/16 arXiv:1703.09039v2 parsifalster
认知科学具有深远的学科,例如人工智能(AI),哲学,心理学,神经科学,语言学和文化。 AI中的许多突破都追溯到认知理论,而AI本身已成为推进认知研究的必不可少的工具。这种相互关系激发了对AI与认知科学之间交集的全面回顾 ...
0 0 0 2025/09/16 arXiv:2508.20674v1 waterfall666
量化感知培训(QAT)和知识蒸馏(KD)结合在一起,以在创建低位深度学习模型中实现竞争性能。但是,将KD应用于QAT的现有作品需要乏味的超参数调整,以平衡不同损失条款的权重,假设标记的培训数据的可用性,并且需要复杂的计算强度培训程序才能良好的表现。为了解决这些局限性,本文提出了一种新颖的自我监督量化知识蒸馏(SQAKD)框架 ...
0 0 0 2025/09/16 arXiv:2403.11106v1 felixslu
在大型语言模型(LLM)快速发展的驱动下,代理有权将固有知识与动态工具使用相结合,从而大大提高了他们解决现实世界任务的能力。与这种演变相一致,AgentsCope引入了新版本(1.0)的重大改进,以全面支持灵活,有效的基于工具的代理环境与建筑物代理应用程序 ...
0 0 0 2025/09/16 arXiv:2508.16279v1 wwb
潜在的生成模型在高保真图像合成中表现出了显着的进展,通常使用两个阶段的训练过程,该过程涉及在第一阶段通过学习的引物将图像压缩到潜在的嵌入式中。一代的质量在很大程度上取决于这些潜在嵌入的表现和优化。尽管已经提出了各种方法来学习有效的潜在表示,但由于受较高频率控制的细节丢失,生成的图像通常缺乏现实主义,尤其是在具有急剧过渡的质感区域 ...
0 0 0 2025/09/16 arXiv:2509.05441v3 1150501302

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)