这是受2018年应用类别理论研讨会的启发的入门,说明性注释的集合,在这些注释中,我们在两个主题(功能语义语义和组合性)(功能性语义语义和组合性)中悠闲地漫步,两个结构(单类类别和装饰的Cospans)和两个示例(化学反应网络和自然语言处理)(化学反应网络和自然语言处理)内部 ...
0 0 0 2025/09/20 arXiv:1809.05923v2 parsifalster
艺术语言模型的状态返回自然语言文本从任何输入文本延续。这种产生连贯的文本扩展的能力意味着重大的复杂性,包括语法和语义知识。在本文中,我们提出了一个数学框架,用于从给定文本的扩展上的概率分布(例如,当今大语模型所学的概率分布)到包含语义信息的丰富类别 ...
0 0 0 2025/09/20 arXiv:2106.07890v2 parsifalster
零射异常检测(ZSAD)试图从任意新型类别中识别异常,提供可扩展和注释有效的解决方案。传统上,大多数ZSAD作品都是基于剪辑模型,该模型通过计算视觉和文本嵌入之间的相似性来执行异常检测。最近,诸如Dinov3之类的Vision Foundation模型表现出强大的可转移表示功能 ...
0 0 0 2025/09/20 arXiv:2509.14084v2 dsy
专家混合 (MoE) 已成为一种在保持计算效率的同时缩放模型大小的重要架构。在 MoE 中,输入序列中的每个 Token 都会激活由路由机制确定的不同专家子集。然而,MoE 模型中未选择的专家不会对输出做出贡献,这可能导致模型能力的利用不足 ...
0 0 0 2025/09/20 arXiv:2405.14507v2 littlecat
大型语言模型(LLM)越来越多地通过开源和商业框架部署,使个人和组织能够自助主持人高级LLM功能。随着LLM部署变得普遍,尤其是在行业中,确保其安全可靠的运营已成为关键问题。但是,不安全的违约和错误配置通常会向公共互联网展示LLM服务,从而带来严重的安全性和系统工程风险 ...
0 0 0 2025/09/20 arXiv:2505.02502v2 translater
在本文中,我们提出了一种对齐对比度学习(ACL)算法,以解决长尾识别问题。我们的发现表明,尽管多视图训练可以提高性能,但随着观点数量的增加,对比度学习并不能始终增强模型的概括。通过对受监督的对比学习(SCL)的理论梯度分析,我们确定了梯度冲突,以及正面和负面对之间的不平衡吸引力和排斥梯度作为基本问题 ...
0 0 0 2025/09/20 arXiv:2506.01071v1 1178945530
设计降水的预警系统需要准确的短期预测系统。气候变化导致极端天气事件的频率增加,因此这种系统可以防止灾难和生命损失。管理此类事件仍然是公共和私人机构的挑战 ...
0 0 0 2025/09/20 arXiv:2311.17961v2 11123
当前的角色扮演研究通常依赖于未验证的LLM-AS-A-A-A-Gudge范式,这可能无法反映人类对角色忠诚的看法。人类一致评估的关键先决条件是角色识别,即认识到谁在对话环境中说话的能力。我们认为,对角色扮演质量的任何有意义的判断(角色的扮演程度)从根本上取决于首先正确地将单词和行为归因于正确的角色(谁在讲话) ...
0 0 0 2025/09/20 arXiv:2508.10014v1 mencius

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)