图形的深度学习模型已在节点分类任务中实现了强大的性能。尽管它们扩散,但目前尚无对他们对对抗攻击的鲁棒性的研究。但是,在可能使用它们的域中,e ...
0 0 0 2025/05/05 arXiv:1805.07984v4 xixiaixixi
 Transformer 层使用多头注意力的交替模式和多层感知器(MLP)层,为各种机器学习问题提供了有效的工具。由于 Transformer 层使用残差连接来避免消失梯度的问题,因此可以将它们视为微分方程的数值集成。在这个扩展的摘要中,我们基于这种联系,并提出了 Transformer 层的内部体系结构的修改 ...
0 0 0 2025/05/05 arXiv:2212.06011v1 haiyao
大型语言模型(LLM)不仅是资源密集型培训,而且在生产中部署的成本更高。因此,最近的工作试图根据廉价代理来修剪LLM,以估计块重要性,从而有效地消除了训练有素的Llama-2和Mismtral 7B模型中10%的块,而没有任何明显的下游度量降低。在本文中,我们通过考虑自适应指标(例如Shapley值)在先前工作中探讨的静态指标,从而探索不同的块重要度量 ...
0 0 0 2025/05/05 arXiv:2407.16286v1 haiyao
先前的研究通常集中在利用大语言模型(LLMS)的内部知识回答已知问题(即\ textit {内部推理,例如生成 - 然后阅读}) ...
0 0 0 2025/05/05 arXiv:2402.13514v2 jueli
面部识别系统容易受到物理和数字攻击的影响,带来了严重的安全风险。传统方法通常由于其独特的特征而分别对这两种攻击类型进行处理。因此,当被攻击合并时,几乎所有方法都无法处理 ...
0 0 0 2025/05/05 arXiv:2408.12793v1 wgkooo
在许多实际应用中,例如财务欺诈检测和网络安全,从归因网络中检测异常节点非常重要。由于异常节点与其他对应物之间的复杂相互作用及其在属性方面的不一致之处,因此这项任务是具有挑战性的。本文提出了一个自我监督的学习框架,该框架共同优化了基于学习的多视图对比度模块和基于属性重建的模块,以更准确地检测属性网络的异常情况 ...
0 0 0 2025/05/05 arXiv:2205.04816v1 dkf
我们考虑开放世界信息提取(开放世界IE)的问题,该问题从非结构化的文本中提取了全面的实体概况。与传统的信息提取(IE)的封闭世界不同,开放世界IE考虑了一个更普遍的情况,在这种情况下,实体和关系可能超出了预定义的本体论。更重要的是,我们寻求开发一个能够执行开放世界IE的大型语言模型(LLM),以提取具有(可能是细粒度的)自然语言指示的理想实体概况 ...
0 0 0 2025/05/05 arXiv:2305.14898v1 jomei
随着大型语言模型(LLM)的深刻发展,他们的安全问题引起了人们的关注。但是,对于LLM,中国安全基准很少,现有的安全分类法是不足的,在正宗的中国场景中缺乏全面的安全检测能力。在这项工作中,我们介绍了ChisafetyBench,这是一种专门的安全基准,用于评估LLMS在识别危险内容和拒绝在中文环境中拒绝回答风险问题的能力的能力 ...
0 0 0 2025/05/05 arXiv:2406.10311v2 jomei

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)