推理模型通过在获得最终答案之前生成扩展的思想链(COTS)来证明在解决复杂和逻辑密集型任务方面取得了显着进展。然而,这种“缓慢思考”的范式的出现,序列产生了许多 Token ,不可避免地引入了实质性的计算开销。为此,它突出了迫切需要有效加速 ...
0 0 0 2025/04/17 arXiv:2504.10903v1 takkeri
强大的运动控制取决于准确的状态估计。但是,大多数腿部机器人的传感器只能提供部分和嘈杂的观察结果,这使得估计特别具有挑战性,尤其是对于地形摩擦和高程图等外部状态。受经典内部模型控制原则的启发,我们将这些外部状态视为干扰,并引入混合内部模型(HIM),以根据机器人的响应进行估算 ...
0 0 0 2025/04/17 arXiv:2312.11460v3 xyyandhtl
我们提出了SeedReam 3.0,这是一种高性能的中文双语图像生成基础模型。我们开发了几项技术改进,以应对种子2中的现有挑战 ...
0 0 0 2025/04/17 arXiv:2504.11346v2 gdutxgz
本文将大型语言模型(LLM)和传统的自然语言处理(NLP)工具比较,用于执行单词细分,词性词(POS)标签以及1900年至1950年的中文文本中命名的Entity Interity识别(NER)。历史中国文档对文本脚本,自然单词边界的缺失以及大量语言语言的缺乏,对文本分析构成挑战。使用上海图书馆共和党杂志语料库的样本数据集,将诸如Jieba和Spacy之类的传统工具与LLM进行了比较,包括GPT- ...
0 0 0 2025/04/17 arXiv:2503.19844v1 firefly2024
测试气味可以损害测试套件的可靠性和阻碍软件维护。尽管存在几种检测测试气味的策略,但很少有人解决它们的去除。传统方法通常依靠静态分析或机器学习,需要大量的努力和专业知识 ...
0 0 0 2025/04/17 arXiv:2504.07277v1 shaoningning
软件源代码中的气味表示次优设计和实施决策的指示,可能会阻碍代码的理解,进而增加了容易变化和错误的可能性。在软件开发过程的早期阶段确定这些代码问题可以减轻这些问题并提高软件的整体质量。当前的研究主要集中于使用基于深度学习的模型来研究源代码指令中隐藏的上下文信息以检测代码气味,而对结构和设计相关功能的重要性有限 ...
0 0 0 2025/04/17 arXiv:2502.05012v1 shaoningning
卷积神经网络(CNN)通过提取空间特征并在基于视觉的任务中提高最先进的精度来彻底改变图像分类。挤压和激发网络提出的模块收集输入的通道定义。多层感知器(MLP)从数据中学习全局表示形式,在大多数图像分类模型中,用于学习图像的提取特征 ...
0 0 0 2025/04/17 arXiv:2311.10807v1 annseongjin
政策蒸馏(PD)已成为改善深度强化学习任务的有效方法。 PD的核心思想是将政策知识从教师代理商提炼为学生代理人。但是,教师学习框架需要一个训练有素的教师模型,该模型在计算上是在此HTTP URL的在线知识蒸馏的光线,我们研究了可以从同样的http url中学习多样化知识之间的知识转移,我们提出了在线策略蒸馏(OPD),以在线学习和在线学习框架(da),在网上学习范围(da),在网上学习的环境(da ...
0 0 0 2025/04/17 arXiv:2406.05488v1 Atlantis

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)