当提供的自然语言提示包含一些培训示例时,GPT-3可以执行许多任务。我们表明,这种类型的少数学习可能是不稳定的:及时的格式,培训示例甚至培训示例的顺序可能会导致准确性从几乎偶然的机会到近乎最先进的范围。我们证明,这种不稳定性源于语言模型对预测某些答案的偏见 ...
0 0 0 2025/03/14 arXiv:2102.09690v2 Cauchy
本文介绍了PDEformer-1,这是一种能够同时解决各种偏微分方程(PDE)的多功能神经求解器。使用PDE表示为计算图,我们促进了PDE中固有的符号和数字信息的无缝集成。随后使用图形 Transformer 和隐式神经表示(INR)来生成无网格预测的溶液 ...
0 0 0 2025/03/14 arXiv:2407.06664v2 wgkooo
本文介绍了 PDEformer,这是一种偏微分方程 (PDE) 的神经求解器,能够同时求解各种类型的 PDE。我们主张以计算图的形式表示偏微分方程,以促进偏微分方程固有的符号和数值信息的无缝集成。采用图 Transformer 和隐式神经表示 (INR) 来生成无网格预测解 ...
0 0 0 2025/03/14 arXiv:2402.12652v3 wgkooo
知识图嵌入提供了一种用于表示知识的多功能技术。这些技术可用于多种应用中,例如完成知识图,以预测缺失的信息,推荐系统,问答,查询扩展等。尽管结构化嵌入了知识图中的信息在现实世界中的挑战是挑战性的 ...
0 0 0 2025/03/14 arXiv:2107.07842v1 sally2016
标准化层在现代神经网络中无处不在,长期以来一直被认为是必不可少的。这项工作表明,没有归一化的 Transformer 可以使用非常简单的技术实现相同或更好的性能。我们介绍了Dynamic Tanh(Dyt),元素操作$ dyt($ x $)= \ tanh(\ alpha $ x $)$,作为变形金刚中归一化层的置换式替换 ...
0 2 0 2025/03/14 arXiv:2503.10622v1 wang123
触觉为人类和机器人的感知和交互能力提供了重要的支持和增强。然而,与触觉相关的多模态研究主要集中在视觉和触觉模态,在语言领域的探索有限。除了词汇之外,句子级描述还包含更丰富的语义 ...
0 0 0 2025/03/14 arXiv:2403.09813v3 smallz
我们介绍了围攻,这是一个多转化的对抗框架,该框架通过树搜索的角度逐渐模拟大语模型(LLM)安全性的逐渐侵蚀。与依靠一个精心设计的提示的单转弯越狱不同,攻城以广度优先的方式扩展了对话,分支了多个对抗性提示,从而利用部分依从性从先前的回应中剥夺。通过跟踪这些增量策略泄漏并将其重新注入随后的查询,围攻揭示了如何将小特许权积累到完全不允许的输出中 ...
0 0 0 2025/03/14 arXiv:2503.10619v1 dm616703
与智能手机相比,在基于MLLM的GUI代理的领域中,PC方案不仅具有更复杂的交互环境,而且还涉及更复杂的Intra Intra Inter-App和Inter-App工作流程。为了解决这些问题,我们提出了一个名为PC-Agent的分层代理框架。具体而言,从感知的角度来看,我们设计了一个主动感知模块(APM),以克服当前MLLM在感知屏幕快照内容中的能力不足 ...
0 0 0 2025/03/14 arXiv:2502.14282v2 elastic

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)