一译 —— 文档和论文翻译、对照阅读、讨论和社区

Integrating SAM Supervision for 3D Weakly Supervised Point Cloud Segmentation

3D语义分割的当前方法提出了有限注释的培训模型，以解决注释大型，不规则和无序的3D点云数据的困难。它们通常仅专注于3D域，而不利用2D和3D数据的互补性质。此外，某些方法扩展了原始标签或生成伪标签以指导培训，但是它们通常无法完全使用这些标签或解决其中的噪音 ...

0 0 0 2025/09/17 arXiv:2508.19909v1 xubiao

KuaiLive: A Real-time Interactive Dataset for Live Streaming Recommendation

实时流媒体平台已成为在线内容消费的一种主要形式，提供动态发展的内容，实时互动以及高度吸引人的用户体验。这些独特的特征引入了新的挑战，这些挑战将实时流媒体推荐与传统建议环境区分开，并近年来引起了行业的越来越多的关注。但是，由于缺乏准确反映出实时流媒体环境的动态性质的公开数据集，学术界的研究进展受到了阻碍 ...

0 0 0 2025/09/17 arXiv:2508.05633v1 sunhao

What do language models model? Transformers, automata, and the format of thought

大型语言模型实际上是什么模型？他们是告诉我们有关人类能力的信息，还是我们已经训练过的语料库的模型？我对后一种立场进行了非流畅的防御。认知科学告诉我们，人类的语言能力依靠上线性格式进行计算。相比之下， Transformer 体系结构充其量最多支持用于处理的线性格式 ...

0 0 0 2025/09/17 arXiv:2508.18598v1 kkkk

ParaThinker: Native Parallel Thinking as a New Paradigm to Scale LLM Test-time Compute

大型语言模型（LLM）的最新进展是由测试时间计算量表驱动的 - 这种策略通过产生更长的顺序思考过程来改善推理。尽管有效，但随着计算的增加，这种方法遇到了显着的瓶颈，在此进一步计算仅提供边际性能增长。我们认为，这种天花板不是模型能力的固有限制，而是缩放策略本身的缺陷，这是我们称为“隧道视觉”的现象，其中模型的不完美初始步骤将其锁定在次优的推理路径中 ...

0 0 0 2025/09/17 arXiv:2509.04475v1 hwrabbit

MM-R5: MultiModal Reasoning-Enhanced ReRanker via Reinforcement Learning for Document Retrieval

多模式文档检索系统启用跨文本，图像和布局的信息访问，从而使各个领域受益，例如基于文档的问题回答，报告分析和交互式内容摘要。 Rerankers通过重新排序检索候选人来提高检索精度。但是，当前的多模式重新骑行方法仍未得到充实，并在培训策略和整体有效性方面有很大的改善空间 ...

0 0 0 2025/09/17 arXiv:2506.12364v2 arthur

The human biological advantage over AI

AI的最新进展增加了AI系统有一天能够做任何人类可以做的事情的可能性，只有更好。如果实现了人工通用智能（AGI），AI系统可能能够以人类越来越无法匹配甚至理解的水平和速度来理解，推理，问题解决，创建和发展。这些可能性提出了一个自然的问题，即AI是否最终将优于人类，即后继的“数字物种”，并有正当地说要领导宇宙 ...

0 0 0 2025/09/17 arXiv:2509.04130v1 kkkk

DeepGraphLog for Layered Neurosymbolic AI

Neurosymbolic AI（NESY）旨在将神经网络的统计优势与符号推理的解释性和结构相结合。但是，当前的NESY框架（例如Deepproblog）强制执行固定流程，其中符号推理始终遵循神经处理。这限制了他们建模复杂依赖性的能力，尤其是在不规则的数据结构（例如图形）中 ...

0 0 0 2025/09/17 arXiv:2509.07665v1 kkkk

ABKD: Pursuing a Proper Allocation of the Probability Mass in Knowledge Distillation via $α$-$β$-Divergence

知识蒸馏（KD）通过最大程度地减少其输出分布之间的差异，通常使用前向kullback-leibler Divergence（FKLD）或反向KLD（RKLD）将知识从大师模型转移到较小的学生模型。由于教师分布提供的更广泛的监督信息，与单热标签相比，它已成为有效的培训范式。 We identify that the core challenge in KD lies in balancing two ...

0 0 0 2025/09/17 arXiv:2505.04560v3 haoyi199815

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）