(gnn))是图表示学习的有效框架。gnn遵循邻域聚合方案,其中节点的表示向量是通过递归聚合和变换其邻近节点的表示向量来计算的。许多gnn变体已经被提出,并在节点和图分类任务上取得了最先进的结果... ...
0 0 1 2025/05/09 arXiv:1810.00826v3 pdssunny
温度控制是一项复杂的任务,由于其通常未知的动态和干扰。本文探讨了神经非线性自回归外源性(NNARX)模型的使用,用于非线性系统识别,并模拟温度控制单元的预测性控制。首先,从实际工厂收集的输入输出数据中确定了NNARX模型,并制定了由已知的可测量状态的状态空间表示,由过去的输入和输出变量组成 ...
0 0 0 2025/05/09 arXiv:2402.05606v1 瞢闇
在工业检查中,很少有射击异常检测(FSAD)是一项至关重要但具有挑战性的任务,在工业检查中,只有几个正常图像必须完成正常的分布建模。尽管现有方法通常采用多模式的基础模型,结合了语言和视觉方式来迅速引入异常检测,但这些方法通常需要复杂的及时及时工程和大量的手动调整。在本文中,我们证明了一个直接的邻居搜索框架可以超过单级和多级FSAD场景中的最先进性能 ...
0 0 0 2025/05/09 arXiv:2504.11895v2 ggggggsm
在这项工作中,我们介绍和评估Selma是一种针对虚拟助手交互的语言语言模型,该模型将音频和文本整合为大型语言模型(LLM)的输入。 Selma旨在处理与单个端到端模型中同时与虚拟助手相互作用相关的三个主要和两个辅助任务。我们采用低级适应模块来对音频编码器和LLM进行参数效率训练 ...
0 0 0 2025/05/09 arXiv:2501.19377v2 zzy_nthu
大型语言模型(LLMS)具有出色的功能,但其高推理成本限制了更广泛的采用。同时增加参数计数可以提高准确性,但它也扩大了最新功能和实际部署性之间的差距。我们提出难题,这是一种硬件感知框架,可以在保留其功能的同时加速LLM的推断 ...
0 0 0 2025/05/09 arXiv:2411.19146v4 odenkkk
我们介绍了Llama-Nemotron系列模型,这是一个开放的异构推理模型家族,可提供出色的推理能力,推理效率和企业使用的开放许可。这个家庭有三种尺寸 - 纳米(8b),Super(49b)和Ultra(253b) - 并与最先进的推理模型(例如DeepSeek-R1)一起竞争,同时提供了出色的推理吞吐量和记忆效率。在本报告中,我们讨论了这些模型的培训程序,这些模型需要使用Llama 3模型的神经 ...
0 0 0 2025/05/09 arXiv:2505.00949v2 odenkkk
大型语言模型的第一代 - 可能被称为生成AI(2020-2023)的“ ACT I”  - 通过大规模参数和数据缩放取得了显着的成功,但表现出了基本的限制,例如知识潜伏期,浅薄的推理和受约束的认知过程。在这个时代,迅速的工程成为我们的主要界面,并通过自然语言实现了对话级别的交流。现在,我们目睹了“第二幕”(2024年至今)的出现,其中模型正在通过测试时间缩放技术从知识回溯系统(在潜在空间中)过渡到 ...
0 0 0 2025/05/09 arXiv:2504.13828v3 zhangxinhao
推理路径是知识图完成(KGC)中可靠的信息,其中算法可以找到实体之间实际关系的强大线索。但是,在实际应用中,很难确保所有候选实体都存在计算负担得起的路径。根据我们的观察,当缺乏路径时,预测准确性显着下降 ...
0 0 0 2025/05/09 arXiv:2505.03285v1 chaojijiayou

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)