一译 —— 文档和论文翻译、对照阅读、讨论和社区

From Pixels to Camera: Scaling Superconducting Nanowire Single-Photon Detectors for Imaging at the Quantum-Limit

超导纳米线单光子检测器（SNSPD）已成为必不可少的设备，它们以前所未有的灵敏度，超高的时序精度和宽光谱响应来推动光子检测的边界。材料工程，超导电子集成和低温系统设计的最新进展正在使SNSPD从单像素检测器转向可伸缩阵列和大型单光子时间标记摄像机。这篇观点文章调查了这一过渡的基础的快速发展的技术格局，重点是创新的超导材料，高级多路复用读取方案和新兴的冷冻兼容电子设备 ...

0 0 0 2025/06/02 arXiv:2505.24725v1 liuyujia

Out-of-Domain Semantics to the Rescue! Zero-Shot Hybrid Retrieval Models

在许多段落检索任务中，基于预训练的语言模型（例如，BERT）的深度检索模型比词汇检索模型（例如，BM25）实现了优越的性能。但是，已经完成了有限的工作，将深度检索模型推广到其他任务和域。在这项工作中，我们仔细选择了五个数据集，包括两个域内数据集和三个具有不同域移动级别的室外数据集，并在零弹位设置中研究了深层模型的概括 ...

0 0 0 2025/06/02 arXiv:2201.10582v1 来自古代的熊

SDSS-IV DR17: Final Release of MaNGA PyMorph Photometric and Deep Learning Morphological Catalogs

我们介绍了漫画Pymorph光度值添加目录（MPP-VAC-DR17）和漫画深度学习形态VAC（MDLM-VAC-DR17），用于漫画调查的最终数据发布，这是SDSS数据版本17（DR17）的一部分。 MPP-VAC-DR17提供的光度参数从sèrsic和sèrsic+指数拟合到$ g $，$ r $和$ i $ bands中的漫画DR17 Galaxy样品的2D表面亮度配置文件（例如， ...

0 0 0 2025/06/02 arXiv:2110.10694v1 liuyujia

Preemptive Hallucination Reduction: An Input-Level Approach for Multimodal Language Model

大语言模型（LLMS）中的视觉幻觉，该模型会产生与视觉输入不一致的响应，对其可靠性构成了重大挑战，尤其是在精确和值得信赖的输出至关重要的情况下。当前的研究在很大程度上强调了事后校正或特定于模型的微调策略，并且对在输入阶段解决幻觉问题的预处理技术的探索有限。这项研究提出了一种新型的基于整体的预处理框架，可自适应地选择最合适的过滤方法 - 降低噪声（NR），Edge增强（EE）或未更换的输入（ORG） ...

0 0 0 2025/06/02 arXiv:2505.24007v1 chenbing

DINO-R1: Incentivizing Reasoning Capability in Vision Foundation Models

诸如DeepSeek-R1之类的大语言模型的推理能力的最新爆炸性兴趣通过基于强化学习的微调框架表现出了显着的成功，这是通过诸如组相对策略优化（GRPO）之类的方法举例的。但是，在视觉基础模型中，此类推理能力仍然没有充满激发，并且在包括Dino系列之类的表示模型中不存在。在这项工作中，我们提出了\ textbf {dino-r1}，这是第一次尝试使用增强学习来激励视觉中的视觉上下文推理能力 ...

0 0 0 2025/06/02 arXiv:2505.24025v1 chenbing

MIRAGE: Assessing Hallucination in Multimodal Reasoning Chains of MLLM

多模式大语言模型（MLLM）中的多模式幻觉限制了MLLM的正确性。然而，多模式幻觉是多源的，是由多种原因引起的。现有的基准无法充分区分感知引起的幻觉和推理引起的幻觉 ...

0 0 0 2025/06/02 arXiv:2505.24238v1 chenbing

Search and Refine During Think: Autonomous Retrieval-Augmented Reasoning of LLMs

大型语言模型表现出了令人印象深刻的推理能力，但本质上受其知识库的限制。通过允许LLM查询外部资源来检索启动的推理可以减轻这种限制，但是现有方法通常会检索无关紧要或嘈杂的信息，从而阻碍了准确的推理。在本文中，我们提出了AutoreFine，这是一种增强培训后的培训后框架，采用了新的``搜索''d-Refine-distring-Inkink''范式 ...

0 0 0 2025/06/02 arXiv:2505.11277v2 chrisxiong

Seeing is Not Reasoning: MVPBench for Graph-based Evaluation of Multi-path Visual Physical CoT

理解由运动定律，空间关系和因果关系控制的物理世界，对多模式大语言模型（MLLM）提出了根本挑战。尽管OpenAI O3和GPT-4O等最近的进步表现出令人印象深刻的知觉和推理能力，但我们的调查揭示了这些模型在视觉物理推理的深刻努力，无法掌握基本的物理定律，空间相互作用，并在复杂场景中的因果效应。更重要的是，他们通常无法遵循以视觉证据为基础的连贯推理链，尤其是当需要多个步骤来得出正确的答案时 ...

0 0 0 2025/06/02 arXiv:2505.24182v1 chenbing

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）