一译 —— 文档和论文翻译、对照阅读、讨论和社区

Machine Bullshit: Characterizing the Emergent Disregard for Truth in Large Language Models

哲学家哈里·法兰克福（Harry Frankfurt）概念化了胡说八道，是指不考虑其真相价值的陈述。虽然先前的工作探索了大型语言模型（LLM）幻觉和摇摇欲坠，但我们提出了机器胡说八道作为一个总体的概念框架，可以使研究人员能够表征LLMS中出现真实性的更广泛现象，并在其基本机制上阐明。我们介绍了废话指数，这是一种新颖的指标，量化了LLMS对真理的冷漠，并提出了一种补充分类法，分析了四种定性形式的废话 ...

0 0 0 2025/09/03 arXiv:2507.07484v1 Joyce0105

A Technical Survey of Reinforcement Learning Techniques for Large Language Models

强化学习（RL）已成为一种变革性的方法，用于结盟和增强大型语言模型（LLMS），应对以下教学，道德一致性和推理能力的关键挑战。这项调查为RL与语言模型的整合奠定了全面的基础，突出了突出的算法，例如近端政策优化（PPO），Q学习和参与者 - 批判性方法。此外，它提供了专门针对LLM的RL技术的广泛技术概述，包括从人类反馈（RLHF）和AI反馈（RLAIF）进行强化学习的基础方法，以及直接偏好优化（D ...

0 0 0 2025/09/03 arXiv:2507.04136v1 sealaes

Continual Adaptation for Autonomous Driving with the Mixture of Progressive Experts Network

基于学习的自主驾驶需要在复杂的流量中持续整合各种知识，但是现有的方法在适应性能力方面表现出重大限制。解决这一差距需要自动驾驶系统，以通过动态调整对不断发展的环境相互作用进行持续适应。这强调了增强连续学习能力以提高系统适应性的必要性 ...

0 0 0 2025/09/03 arXiv:2502.05943v2 kateaaaaa

FineZip : Pushing the Limits of Large Language Models for Practical Lossless Text Compression

尽管已证明语言建模目标与压缩密切相关，但令人惊讶的是，现代LLM不用于实用的文本压缩系统。在本文中，我们对基于神经网络和基于 Transformer 的压缩技术进行了深入的分析，以回答这个问题。我们将传统文本压缩系统与神经网络和基于LLM的文本压缩方法进行比较 ...

0 0 0 2025/09/03 arXiv:2409.17141v1 0x211

Object Fidelity Diffusion for Remote Sensing Image Generation

高精度可控的遥感图像产生既有意义又具有挑战性。现有的扩散模型通常由于无法充分捕获形态学细节而产生低保真图像，这可能会影响对象检测模型的鲁棒性和可靠性。为了提高遥感中生成的对象的准确性和保真度，本文提出了对象的保真度扩散（DIFF），从而有效地改善了生成的对象的保真度 ...

0 0 0 2025/09/02 arXiv:2508.10801v2 Fun_James

Efficient Medical VIE via Reinforcement Learning

视觉信息提取（VIE）将非结构化的文档图像转换为JSON等结构化格式，这对于报告分析和在线咨询等医学应用至关重要。传统方法依赖于OCR和语言模型，而端到端的多模型模型则提供直接的JSON生成。但是，特定领域的模式和高注释成本限制了其在医疗竞争中的有效性 ...

0 0 0 2025/09/02 arXiv:2506.13363v1 moshmode

DualToken: Towards Unifying Visual Understanding and Generation with Dual Visual Vocabularies

视觉理解和产生所需的不同表示空间在将它们统一的大型语言模型的自回归范式中构成挑战。经过重建的视觉 Token 机构擅长捕获低级感知细节，使其非常适合视觉生成，但缺乏用于理解任务的高级语义表示。相反，通过对比度学习训练的视觉编码器与语言良好相符，但努力将其解码回到像素空间中以进行生成任务 ...

0 0 0 2025/09/02 arXiv:2503.14324v2 15966829631

GLARE: Low Light Image Enhancement via Generative Latent Feature based Codebook Retrieval

大多数现有的低光图像增强（LLIE）方法要么将低光（LL）直接映射到正常光（NL）图像，要么将语义或照明图用作指南。但是，llie的不良性质和从投入受损的语义检索难度限制了这些方法，尤其是在极低的光线条件下。为了解决此问题，我们通过基于生成潜在特征的代码书检索（Glare）提出了一个新的LLIE网络，其中使用矢量量化（VQ）策略从未依据的NL图像中得出了代码书的先验 ...

0 0 0 2025/09/02 arXiv:2407.12431v1 tl010403

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）