以事件驱动的方式运行并采用二进制尖峰表示的尖峰神经网络(SNN)最近成为能效计算的有前途的候选人。但是,获得高性能SNN的成本瓶颈是出现的:训练SNN模型还需要大量的时间步骤,除了通常的学习迭代外,这限制了他们的能源效率。本文提出了一个通用培训框架,该框架在有限的时间步骤内提高了特征学习和激活效率,为更节能的SNN提供了新的解决方案 ...
0 0 0 2025/09/30 arXiv:2401.10843v1 Roa
策略作为代码(PAC)是一个范式,将安全性和合规性策略编码为机器可读格式,从而使基础架构中的自动执法能够作为代码(IAC)环境。但是,政策语言的复杂性和不符的风险阻碍了其采用。在这项工作中,我们介绍了Arpaccino,这是一种结合大型语言模型(LLM),检索成绩(RAG)和基于工具的验证的代理系统,以自动化PAC规则的生成和验证 ...
0 0 0 2025/09/30 arXiv:2507.10584v1 s_75san
大型语言模型(LLM)越来越多地通过从可验证的奖励(RLVR)学习的加强学习中训练,但是现实世界中的部署要求模型可以在没有标签或外部法官的情况下自我爆发。现有的无标签方法,最小化的信心,自矛盾或多数票数目标,稳定学习,但稳步收缩探索,导致熵崩溃:世代变得更短,多样化和脆弱。与先前的方法(例如测试时间增强学习(TTRL))不同,该方法主要将模型适应了即时未标记的数据集,我们的目标是更广泛的:在不牺牲 ...
0 0 0 2025/09/30 arXiv:2509.15194v1 18812680264
基础模型的最新进展突出了统一和扩展的明确趋势,显示了各种领域的新兴能力。尽管图像生成和编辑已迅速从特定于任务的框架过渡到统一的框架,但由于建筑局限性和数据稀缺性,视频生成和编辑仍然存在分散。在这项工作中,我们介绍了Editverse,这是一个统一的图像和视频生成框架,并在单个模型中进行编辑 ...
0 0 0 2025/09/30 arXiv:2509.20360v2 suxuefeng
由于其高质量的结果以及与硬件栅格化的兼容性,3D高斯脱落最近被视为场景重建和新型视图合成的一种多功能有效的方法。尽管具有优势,但高斯的脱落依赖于结构 - 轻度(SFM)算法的高质量点云初始化是要克服的重要限制。为此,我们研究了高斯裂开的各种初始化策略,并深入研究了如何利用来自神经辐射场(NERF)的体积重构来绕过对SFM数据的依赖性 ...
0 0 0 2025/09/30 arXiv:2404.12547v3 zhifeiji
视觉和语言导航需要一个体现的代理在自然语言说明和连续视频流的指导下遍历看不见的环境。 VLN的最新进展是由对多模式大语言模型的强大语义理解所驱动的。但是,这些方法通常依赖于明确的语义记忆,例如构建文本认知图或存储历史视觉框架 ...
0 0 0 2025/09/30 arXiv:2509.22548v1 weanhear
拓扑神经网络已成为图形神经网络的强大继任者。但是,它们通常涉及高阶消息传递,这会产生大量的计算费用。我们通过一个新型的拓扑框架来绕过这个问题,该拓扑框架在组合复合物(CCS)上引入了Laplacian操作员,从而有效地计算了作为节点描述符的热核 ...
0 0 0 2025/09/30 arXiv:2507.12380v1 DamnMan
大型语言模型(LLM)的长篇小说涉及在主要由短序列和一小部分较长序列组成的数据集上进行培训。但是,现有方法忽略了这种长尾分布和采用专门为长序列设计的培训策略。此外,这些方法还无法解决分布式训练期间可变序列长度所带来的挑战,例如数据并行性中的负载不平衡和管道并行性中的严重管道气泡 ...
0 1 3 2025/09/30 arXiv:2503.02356v3 zhangmuhua

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)