全景分割涉及关节语义分割和实例分割的组合,其中图像内容分为两种类型:事物和东西。我们提出了Panoptic Segformer,这是用于使用 Transformer 的泛型分割的一般框架。它包含三个创新组件:一种有效的深度监督面罩解码器,一种查询解耦策略以及改进的后处理方法 ...
0 0 0 2025/06/05 arXiv:2109.03814v4 cynophile
尽管大语言模型(LLMS)取得了显着的成功,但基础 Transformer 体系结构在处理复杂的推理任务方面具有固有的局限性。经过思考链(COT)提示已成为一种实际的解决方法,但是大多数基于COT的方法都依赖于单个通用的提示,例如“逐步思考”,而没有特定于任务的适应性。这些方法希望该模型自己发现有效的推理路径,从而迫使其搜索庞大的及时空间 ...
0 0 0 2025/06/05 arXiv:2503.10084v2 Roa
大型语言模型是自动化漏洞检测的有前途的工具,这要归功于它们在代码生成和维修方面的成功。但是,尽管采用了广泛的采用,但仍然存在一个关键的问题:LLM是否真的有效地检测现实世界的漏洞?当前的评估通常评估孤立功能或文件的模型,忽略了更广泛的执行和数据流上下文,这对于理解漏洞必不可少。这种监督导致了两种误导性结果:不正确的结论和有缺陷的理由,总体破坏了先前评估的可靠性 ...
0 0 0 2025/06/05 arXiv:2504.13474v1 vtestyiqi
机器学习(ML)数据集通常被认为是中性的,本质上封装了抽象和有争议的社会结构。数据集策展人经常采用具有价值的术语,例如多样性,偏见和质量来表征数据集。尽管存在盛行,但这些术语仍缺乏明确的定义和验证 ...
0 0 0 2025/06/05 arXiv:2407.08188v1 zhtzhtzht
Vision Foundation模型(VFM)在各种下游任务中表现出了出色的性能。尽管几个VFM适配器通过利用VFM的先验知识显示出令人鼓舞的结果,但我们在这些方法中确定了两种效率低下。首先,卷积神经网络(CNN)和VFM主链之间的相互作用触发早期层梯度反向传播 ...
0 0 27 2025/06/05 arXiv:2506.03433v1 haoyi199815
许多自然语言处理(NLP)任务自然失衡,因为某些目标类别的发生频率要比现实世界中的其他类别更频繁。在这种情况下,当前的NLP模型在较不频繁的类别上仍然往往差得很差。在NLP中解决阶级不平衡是一个积极的研究主题,但是,很难找到针对特定任务和不平衡情况的好方法 ...
0 0 0 2025/06/05 arXiv:2210.04675v2 DECEM
在过去的十年中,卷积神经网络(CNN)已被广泛用作端到端音频分类模型的主要构件,该模型旨在学习从音频频谱到相应标签的直接映射。为了更好地捕获远距离的全球环境,最近的趋势是在CNN之上添加自我注意力的机制,形成CNN引入混合模型。但是,目前尚不清楚是否需要依赖CNN,并且纯粹基于注意力的神经网络足以在音频分类中获得良好的表现 ...
0 0 0 2025/06/05 arXiv:2104.01778v3 hynj
基于大语言模型的代理利用工具来修改环境,彻底改变了AI与物理世界的相互作用。与仅依靠历史对话的传统NLP任务不同,这些代理必须考虑更复杂的因素,例如在做出选择时,例如工具间关系,环境反馈和以前的决策。当前的研究通常通过多转对话来评估代理 ...
0 0 0 2025/06/05 arXiv:2505.18746v2 lb47719448

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)