一译 —— 文档和论文翻译、对照阅读、讨论和社区

A Survey of Zero-Knowledge Proof Based Verifiable Machine Learning

随着机器学习技术在各个领域迅速发展，对数据隐私和模型安全性的担忧显着增长。由于用户最终设备的计算资源限制，当模型经过训练和部署在云平台或第三方服务器上时，这些挑战尤其明显。作为回应，零知识证明（ZKP）技术已成为一种有希望的解决方案，从而有效地验证了培训和推理过程中的模型性能和真实性，而无需披露敏感数据 ...

0 0 0 2025/08/28 arXiv:2502.18535v1 cella

VideoWorld: Exploring Knowledge Learning from Unlabeled Videos

这项工作探讨了深层生成模型是否可以仅从视觉输入中学习复杂的知识，与普遍关注基于文本的模型（如大语言模型（LLM））相比。我们开发了VideOworld，这是一种自动回归视频生成模型，该模型在未标记的视频数据上培训，并在基于视频的GO和机器人控制任务中测试其知识获取能力。我们的实验揭示了两个关键的发现：（1）仅视频培训提供了足够的学习知识信息，包括规则，推理和计划功能，以及（2）视觉变化的表示对于知 ...

0 0 0 2025/08/28 arXiv:2501.09781v2 陆三七

Provably Secure Retrieval-Augmented Generation

尽管已广泛应用了检索增强的发电（RAG）系统，但尚未系统地解决他们所面临的隐私和安全风险，例如数据泄漏和数据中毒。现有的防御策略主要依赖于启发式过滤或增强回猎犬的鲁棒性，这些策略的可解释性有限，缺乏正式的安全保证和适应性攻击的脆弱性。为了应对这些挑战，本文提出了第一个可证明的抹布系统（SAG）的安全框架 ...

0 0 0 2025/08/28 arXiv:2508.01084v1 cella

Evaluating Step-by-step Reasoning Traces: A Survey

逐步推理被广泛用于增强复杂问题中大语言模型（LLM）的推理能力。评估推理轨迹的质量对于理解和改善LLM推理至关重要。但是，评估标准仍然高度不合格，导致在制定指标和元评估基准方面的努力分散 ...

0 0 0 2025/08/28 arXiv:2502.12289v2 wtyang

IndicVoices-R: Unlocking a Massive Multilingual Multi-speaker Speech Corpus for Scaling Indian TTS

文本到语音（TTS）合成的最新进展表明，经过广泛的Web数据训练的大型模型产生了高度自然的输出。但是，由于缺乏在Librivox或YouTube等平台上的高质量，手动副标题的数据，印度语言的此类数据很少。为了解决这一差距，我们增强了现有的大规模ASR数据集，这些数据集包含在低质量环境中收集的自然对话，以生成高质量的TTS培训数据 ...

0 0 0 2025/08/28 arXiv:2409.05356v2 sja

Long-Term_Feature_Banks_for_Detailed_Video_Understanding

0 0 0 2025/08/28 KaimingHe

Convolutional_Feature_Masking_for_Joint_Object_and_Stuff_Segmentation

0 0 0 2025/08/28 KaimingHe

Object_Detection_Networks_on_Convolutional_Feature_Maps

0 0 0 2025/08/28 KaimingHe

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）