一译 —— 文档和论文翻译、对照阅读、讨论和社区

Panoptic SegFormer: Delving Deeper into Panoptic Segmentation with Transformers

全景分割涉及关节语义分割和实例分割的组合，其中图像内容分为两种类型：事物和东西。我们提出了Panoptic Segformer，这是用于使用 Transformer 的泛型分割的一般框架。它包含三个创新组件：一种有效的深度监督面罩解码器，一种查询解耦策略以及改进的后处理方法 ...

0 0 0 2025/06/05 arXiv:2109.03814v4 cynophile

Why Prompt Design Matters and Works: A Complexity Analysis of Prompt Search Space in LLMs

尽管大语言模型（LLMS）取得了显着的成功，但基础 Transformer 体系结构在处理复杂的推理任务方面具有固有的局限性。经过思考链（COT）提示已成为一种实际的解决方法，但是大多数基于COT的方法都依赖于单个通用的提示，例如“逐步思考”，而没有特定于任务的适应性。这些方法希望该模型自己发现有效的推理路径，从而迫使其搜索庞大的及时空间 ...

0 0 0 2025/06/05 arXiv:2503.10084v2 Roa

Everything You Wanted to Know About LLM-based Vulnerability Detection But Were Afraid to Ask

大型语言模型是自动化漏洞检测的有前途的工具，这要归功于它们在代码生成和维修方面的成功。但是，尽管采用了广泛的采用，但仍然存在一个关键的问题：LLM是否真的有效地检测现实世界的漏洞？当前的评估通常评估孤立功能或文件的模型，忽略了更广泛的执行和数据流上下文，这对于理解漏洞必不可少。这种监督导致了两种误导性结果：不正确的结论和有缺陷的理由，总体破坏了先前评估的可靠性 ...

0 0 0 2025/06/05 arXiv:2504.13474v1 vtestyiqi

Position: Measure Dataset Diversity, Don't Just Claim It

机器学习（ML）数据集通常被认为是中性的，本质上封装了抽象和有争议的社会结构。数据集策展人经常采用具有价值的术语，例如多样性，偏见和质量来表征数据集。尽管存在盛行，但这些术语仍缺乏明确的定义和验证 ...

0 0 0 2025/06/05 arXiv:2407.08188v1 zhtzhtzht

ViT-Split: Unleashing the Power of Vision Foundation Models via Efficient Splitting Heads

Vision Foundation模型（VFM）在各种下游任务中表现出了出色的性能。尽管几个VFM适配器通过利用VFM的先验知识显示出令人鼓舞的结果，但我们在这些方法中确定了两种效率低下。首先，卷积神经网络（CNN）和VFM主链之间的相互作用触发早期层梯度反向传播 ...

0 0 27 2025/06/05 arXiv:2506.03433v1 haoyi199815

A Survey of Methods for Addressing Class Imbalance in Deep-Learning Based Natural Language Processing

许多自然语言处理（NLP）任务自然失衡，因为某些目标类别的发生频率要比现实世界中的其他类别更频繁。在这种情况下，当前的NLP模型在较不频繁的类别上仍然往往差得很差。在NLP中解决阶级不平衡是一个积极的研究主题，但是，很难找到针对特定任务和不平衡情况的好方法 ...

0 0 0 2025/06/05 arXiv:2210.04675v2 DECEM

AST: Audio Spectrogram Transformer

在过去的十年中，卷积神经网络（CNN）已被广泛用作端到端音频分类模型的主要构件，该模型旨在学习从音频频谱到相应标签的直接映射。为了更好地捕获远距离的全球环境，最近的趋势是在CNN之上添加自我注意力的机制，形成CNN引入混合模型。但是，目前尚不清楚是否需要依赖CNN，并且纯粹基于注意力的神经网络足以在音频分类中获得良好的表现 ...

0 0 0 2025/06/05 arXiv:2104.01778v3 hynj

$C^3$-Bench: The Things Real Disturbing LLM based Agent in Multi-Tasking

基于大语言模型的代理利用工具来修改环境，彻底改变了AI与物理世界的相互作用。与仅依靠历史对话的传统NLP任务不同，这些代理必须考虑更复杂的因素，例如在做出选择时，例如工具间关系，环境反馈和以前的决策。当前的研究通常通过多转对话来评估代理 ...

0 0 0 2025/06/05 arXiv:2505.18746v2 lb47719448

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）