近年来,为了能够将人工智能快速部署到计算和内存受限的小型设备中,深度网络剪枝引起了人们的广泛关注。修剪通常是通过删除冗余权重、神经元或深度网络层来实现的,同时尝试保留可比较的测试性能。许多深度剪枝算法已经被提出,并取得了令人印象深刻的经验成功... ...
0 0 0 2025/05/14 arXiv:2302.05601v3 weight
随着大语言模型(LLM)的发展,我们可以在包括电子表格在内的各个领域(包括电子表格)越来越复杂的NLP任务。这项工作调查了LLM是否可以生成代码(Excel Officescripts,用于在Excel中执行许多任务的打字稿API),该API解决了通过自然语言用户指令提供的Excel特定任务。为此,我们介绍了一个新的大规模基准,即DisterenchExcel,它通过利用Excel中的“ Auto ...
0 0 0 2025/05/14 arXiv:2310.14495v1 lunarcloud
本文介绍了Embcomp,这是一种比较两种嵌入的新方法,这些方法可以捕获对象之间的相似性,例如单词和文档嵌入。我们调查比较这些嵌入空间的方案很有用。从这些情况下,我们得出了共同的任务,引入了支持这些任务的视觉分析方法,并将它们组合成全面的系统 ...
0 0 0 2025/05/14 arXiv:1911.01542v2 saya
图形注意力网络(GAT)是最受欢迎的GNN体系结构之一,被视为用图表进行表示的最新体系结构。在GAT中,每个节点都以自己的表示形式为邻居。但是,在本文中,我们表明GAT计算出非常有限的注意力:在查询节点上,注意分数的排名无条件 ...
0 0 0 2025/05/14 arXiv:2105.14491v3 tuxiaolv
地理术语之间语义相似性的计算指标为地理信息检索,数据挖掘和信息集成提供了宝贵的支持。迄今为止,已经设计了各种各样的地理语义相似性方法。相似性的判断不是本质上是对与错,而是获得一定程度的认知合理性,这取决于它的模仿人类行为的近距离 ...
0 0 0 2025/05/14 arXiv:1401.2517v1 llleo
本文介绍了一项有关使用深钢筋学习(RL)为两体机器人创建动态运动控制器的全面研究。除了专注于单个运动技能之外,我们还开发了一种通用控制解决方案,该解决方案可用于一系列动态的双皮亚技能,从定期步行和跑步到Aperiodic的跳跃和站立。我们的基于RL的控制器结合了一种新颖的双历史架构,利用了机器人的长期和短期输入/输出(I/O)历史记录 ...
0 0 0 2025/05/14 arXiv:2401.16889v2 1030046837
预处理数据对语言模型(LMS)的行为和质量有直接影响,但我们只了解这种关系的最基本原理。尽管大多数工作都集中在预处理数据对下游任务行为的影响,但我们研究了数据与LM表示的关系。先前的工作发现,在语言模型中,某些概念在表示形式中编码为“线性”,但是哪些因素导致这些表示形式形成?我们研究了预读取数据频率与模型的事实关系的线性表示之间的联系 ...
0 0 0 2025/05/14 arXiv:2504.12459v1 hxhhxh
联合源通道编码(JSCC)通过将源和渠道统计信息共同纳入系统设计,为提高传输效率提供了有希望的途径。该领域的一个关键进步是Deep联合源和通道编码(DEEPJSCC)技术,该技术将输入信号直接映射到由神经网络参数为参数的通道符号的直接​​映射,可以培训用于任意信道模型和语义质量指标。本文将DEEPJSCC框架推向了语义一致的高保真传输方法,称为语义引导的扩散DEEPJSCC(SGD-JSCC) . ...
0 0 0 2025/05/14 arXiv:2501.01138v1 moonie

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)