一译 —— 文档和论文翻译、对照阅读、讨论和社区

RL-finetuning LLMs from on- and off-policy data with a single algorithm

我们引入了一种新颖的增强学习算法（用于微调大型模型的农业，用于任何产生奖励优化）。 Agro利用了发电一致性的概念，该概念指出，最佳政策满足了任何可能产生的模型的一致性概念。我们得出通过基于样本的策略梯度找到最佳解决方案的算法，并为其收敛提供理论保证 ...

0 0 0 2025/04/24 arXiv:2503.19612v2 leec

InternVL3: Exploring Advanced Training and Test-Time Recipes for Open-Source Multimodal Models

我们介绍了InternVL3，这是Intervl系列的重大进步，该系列具有本地多模式预训练范式。 Intervl3并没有将仅文本大语模型（LLM）调整为支持视觉输入的多模式大型语言模型（MLLM），而是在单个预训练阶段中共同从多样化的多模式数据和纯文本公司中获得多模式和语言能力。这种统一的训练范式有效地解决了MLLM的常规事后培训管道中通常遇到的复杂性和一致性挑战 ...

0 0 0 2025/04/24 arXiv:2504.10479v3 lifeicheng

Universal Fingerprint Generation: Controllable Diffusion Model with Multimodal Conditions

合成数据用于指纹识别的利用引起了人们的关注，因为它有可能减轻有关敏感生物识别数据的隐私问题的潜力。但是，当前生成指纹的方法在创建具有有用的类内变化的同一手指的印象时存在局限性。为了应对这一挑战，我们提出了Genprint，这是一个框架，用于生成各种类型的指纹图像，同时保持身份，并提供对不同外观因素（例如指纹类别，获取类型，传感器设备和质量水平）的人类可理解的控制 ...

0 0 0 2025/04/24 arXiv:2404.13791v1 wang123456

M4: Multi-generator, Multi-domain, and Multi-lingual Black-Box Machine-Generated Text Detection

大型语言模型（LLMS）表现出非常出色的能力，可以对各种用户查询产生流利的响应。但是，这也引起了人们对新闻，教育和学术界此类文本的潜在滥用的担忧。在这项研究中，我们努力创建可以检测机器生成的文本并确定潜在滥用的自动化系统 ...

0 0 0 2025/04/24 arXiv:2305.14902v2 15966829631

From Human Memory to AI Memory: A Survey on Memory Mechanisms in the Era of LLMs

记忆是编码，存储和检索信息的过程，使人类可以随着时间的流逝保留经验，知识，技能和事实，并作为与世界成长和有效互动的基础。它在塑造我们的身份，做出决策，从过去的经验中学习，建立关系并适应变化方面起着至关重要的作用。在大型语言模型（LLM）时代，内存是指AI系统保留，回忆和使用过去互动中信息以改善未来响应和互动的能力 ...

0 0 0 2025/04/24 arXiv:2504.15965v2 zychun

Dynamic Prompt Optimizing for Text-to-Image Generation

文本对图像生成模型，特别是基于成像和稳定扩散等扩散模型的模型，已取得了重大进步。最近，对文本提示的精致完善引起了人们的兴趣。用户分配权重或更改文本中某些单词的注入时间步骤，以提高生成图像的质量 ...

0 0 0 2025/04/24 arXiv:2404.04095v1 casljl

MaxEVA: Maximizing the Efficiency of Matrix Multiplication on Versal AI Engine

深度学习（DL）工作负载的计算和内存需求不断提高，导致了硬件体系结构的出色创新。此类体系结构的原型是AMD/Xilinx的新型Versal AI引擎（AIE）。 AIE包括针对基于向量的算法优化的多个可编程处理器 ...

0 0 0 2025/04/24 arXiv:2311.04980v2 zasolla

Computer-Aided Layout Generation for Building Design: A Review

在计算机视觉和架构域中都研究了用于自动建筑设计的现实建筑布局。基于优化技术或启发式设计指南的建筑领域的传统方法可以综合理想的布局，但通常需要后处理并涉及设计管道中的人类互动，从而使它们昂贵且昂贵。深层生成模型的出现显着提高了生成的建筑布局的忠诚度和多样性，从而减少了设计师的工作量，并使过程更加有效 ...

0 0 1 2025/04/24 arXiv:2504.09694v1 wonglliam

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）