知识图嵌入提供了一种用于表示知识的多功能技术。这些技术可用于多种应用中,例如完成知识图,以预测缺失的信息,推荐系统,问答,查询扩展等。尽管结构化嵌入了知识图中的信息在现实世界中的挑战是挑战性的 ...
0 0 0 2025/03/14 arXiv:2107.07842v1 sally2016
标准化层在现代神经网络中无处不在,长期以来一直被认为是必不可少的。这项工作表明,没有归一化的 Transformer 可以使用非常简单的技术实现相同或更好的性能。我们介绍了Dynamic Tanh(Dyt),元素操作$ dyt($ x $)= \ tanh(\ alpha $ x $)$,作为变形金刚中归一化层的置换式替换 ...
0 2 0 2025/03/14 arXiv:2503.10622v1 wang123
触觉为人类和机器人的感知和交互能力提供了重要的支持和增强。然而,与触觉相关的多模态研究主要集中在视觉和触觉模态,在语言领域的探索有限。除了词汇之外,句子级描述还包含更丰富的语义 ...
0 0 0 2025/03/14 arXiv:2403.09813v3 smallz
我们介绍了围攻,这是一个多转化的对抗框架,该框架通过树搜索的角度逐渐模拟大语模型(LLM)安全性的逐渐侵蚀。与依靠一个精心设计的提示的单转弯越狱不同,攻城以广度优先的方式扩展了对话,分支了多个对抗性提示,从而利用部分依从性从先前的回应中剥夺。通过跟踪这些增量策略泄漏并将其重新注入随后的查询,围攻揭示了如何将小特许权积累到完全不允许的输出中 ...
0 0 0 2025/03/14 arXiv:2503.10619v1 dm616703
与智能手机相比,在基于MLLM的GUI代理的领域中,PC方案不仅具有更复杂的交互环境,而且还涉及更复杂的Intra Intra Inter-App和Inter-App工作流程。为了解决这些问题,我们提出了一个名为PC-Agent的分层代理框架。具体而言,从感知的角度来看,我们设计了一个主动感知模块(APM),以克服当前MLLM在感知屏幕快照内容中的能力不足 ...
0 0 0 2025/03/14 arXiv:2502.14282v2 elastic
尽管多机构协作大语模型(LLMS)在文本到SQL任务中取得了重大突破,但其性能仍然受到各种因素的限制。这些因素包括框架不完整,未能遵循说明和模型幻觉问题。为了解决这些问题,我们提出了OpenSearch-SQL,将文本到SQL任务划分为四个主要模块:预处理,提取,生成和改进,以及基于一致性比对机制的对齐模块 ...
0 1 0 2025/03/14 arXiv:2502.14913v1 zkq
本文介绍了Conformer-1,这是一种端到端自动语音识别(ASR)模型,该模型在570k小时的语音音频数据的广泛数据集中训练,其中91%是从公开可用来源中获得的。为了实现这一目标,我们在使用强符构象异构体RNN-T基线模型为未标记的公共数据生成伪标记后进行嘈杂的学生培训。这些伪标记的数据的添加导致相对单词错误率(WER)的显着提高11 ...
0 1 0 2025/03/14 arXiv:2404.07341v2 kbwzy
深度神经网络在许多关键领域(例如自动驾驶,面部识别和医学诊断)中起着至关重要的作用。但是,深层神经网络正面临后门攻击的安全威胁,可以通过后门攻击者操纵攻击者决定的行为。为了捍卫后门,先前的研究重点是使用干净的数据在模型部署之前删除后门攻击 ...
0 0 0 2025/03/14 arXiv:2308.06107v2 hhhhh

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)