由于当今大部分数据可以表示为图形,因此需要将神经网络模型推广到图形数据。图表卷积神经网络(GCN)的使用情况是,最近显示出富有成果的结果并因此越来越兴趣。已证明它们可以在网络分析中对广泛的任务进行重大改进,其中之一是节点表示学习 ...
0 0 0 2025/03/27 arXiv:1808.06354v1 QingXiang
参数效率调整(PEFT)技术(例如低级别适应性(LORA))在大语言模型上提供培训效率,但它们对模型性能的影响仍然有限。最近的努力集成了洛拉和专家的混合物(MOE),以提高PEFT方法的性能。尽管结果有希望,但有关提高MOE洛拉效率的研究仍处于早期阶段 ...
0 0 0 2025/03/27 arXiv:2402.08562v1 smallz
这项工作是由两个关键趋势激励的。一方面,大型语言模型(LLMS)在各种生成任务(例如写作,绘图和问题答案)中表现出显着的多功能性,从而大大减少了许多常规任务所需的时间。另一方面,研究人员的工作不仅是耗时的,而且是高度专业知识,他们面临越来越多的挑战,因为他们必须花更多的时间阅读,写作和审查论文 ...
0 0 0 2025/03/27 arXiv:2406.16253v3 yezipiaomu
从图形数据中学习时,图和节点具有有关节点标签的嘈杂信息。在本文中,我们提出了一种算法,以共同降低特征并重新布线图(JDR),从而改善了下游节点分类图形神经网(GNNS)的性能。 JDR通过对齐图和特征矩阵的主要光谱空间来起作用 ...
0 0 0 2025/03/27 arXiv:2408.07191v3 xixiaixixi
心理理论(TOM)评估目前使用固有缺乏互动性的被动叙事进行测试模型。我们介绍了Fantom,这是一种新的基准测试,旨在通过问题回答在信息与对称的对话环境中强调测试。我们的基准借鉴了心理学的重要理论要求,并在评估大语言模型(LLMS)时必要的经验考虑 ...
0 0 0 2025/03/27 arXiv:2310.15421v3 zhanjanis
我们介绍了两个具有挑战性的数据集,这些数据集可靠地导致机器学习模型的性能实质上降级。使用简单的对抗过滤技术收集数据集,以创建具有有限伪造提示的数据集。我们数据集的现实世界中未经修改的示例可靠地转移到各种看不见的模型,表明计算机视觉模型具有共同的弱点 ...
0 0 0 2025/03/27 arXiv:1907.07174v4 18303473007
量子计算是一种具有广泛应用的变革性技术,有效的量子电路的产生对于释放其全部潜力至关重要。当前基于U-NET体系结构的当前扩散模型方法在有希望的同时遇到与计算效率和建模全球环境相关的挑战。为了解决这些问题,我们提出了一种新型的U-NET式扩散 Transformer 体系结构Udit,它结合了U-NET在多尺度功能提取中的优势与 Transformer 对全球环境建模的能力 ...
0 0 0 2025/03/27 arXiv:2501.16380v1 oracle
学习连续的时间点过程对于许多离散事件预测任务至关重要。但是,集成构成了一个主要的挑战,特别是对于时空点过程(STPP),因为它涉及通过时空和时间上三个积分来计算可能性。集成STPP的现有方法要么假定强度函数的参数形式,因此缺乏灵活性。或用蒙特卡洛采样近似强度,这引入了数值误差 ...
0 0 0 2025/03/27 arXiv:2310.06179v2 tuxiaolv

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)