arxiv的文档

arxiv 南京

个性签名 ...

Boosting Reward Model with Preference-Conditional Multi-Aspect Synthetic Data Generation

奖励模型 (RM) 对于使大型语言模型 (LLM) 与人类偏好保持一致至关重要。他们使用偏好数据集进行训练，其中每个示例都包含一个输入提示、两个响应和一个偏好标签。由于构建高质量的人类标记偏好数据集既耗时又昂贵，人们通常依赖现有强大的 LLM 来生成偏好标签 ...

0 0 0 0 2025/06/20 arXiv:2407.16008v2 Chris_

3D human pose estimation in video with temporal convolutions and semi-supervised training

在这项工作中，我们证明，可以通过基于扩张的时间卷积在2D关键点上的扩张时间卷积来有效地估算视频中的3D姿势。我们还介绍了一种简单有效的半监督训练方法，该方法利用了未标记的视频数据。我们从未标记的视频预测的2D关键点开始，然后估算3D姿势，最后回到输入2D关键点 ...

0 0 0 0 2025/06/20 arXiv:1811.11742v2 qinhui_cici

CLONE: Closed-Loop Whole-Body Humanoid Teleoperation for Long-Horizon Tasks

类人动物的近亲在演示和收集复杂的类人形景相互作用的数据中起着至关重要的作用。但是，当前的远程操作系统面临着关键的局限性：它们将上半身控制和下半身控制脱致以保持稳定性，限制自然协调并在没有实时位置反馈的情况下操作开环，从而导致累积的漂移。基本的挑战是在延长的持续时间内实现精确的，协调的全身远程运行，同时保持准确的全球定位 ...

0 0 1 1 2025/06/20 arXiv:2506.08931v1 Langston

Align Attention Heads Before Merging Them: An Effective Way for Converting MHA to GQA

大型语言模型已被证明可以在各种自然语言处理问题上表现良好。但是，随着模型大小和输入序列的长度的增加，KV缓存的迅速增加显着降低了推理速度。因此，GQA模型是MHA模型的替代方法，已被广泛引入LLMS ...

0 0 0 0 2025/06/20 arXiv:2412.20677v1 youkbok

TAROT: Targeted Data Selection via Optimal Transport

我们提出了塔罗牌，塔罗牌是一个以最佳运输理论为基础的目标数据选择框架。先前的目标数据选择方法主要依赖于基于影响力的贪婪启发式方法来增强特定领域的性能。虽然对有限的单峰数据有效（i ...

0 0 0 0 2025/06/20 arXiv:2412.00420v1 the_highflyer

CheXGenBench: A Unified Benchmark For Fidelity, Privacy and Utility of Synthetic Chest Radiographs

我们介绍了Chexgenbench，这是一个严格且多方面的评估框架，用于合成胸部X光片生成，同时评估了最先进的文本对图像生成模型的保真度，隐私风险和临床实用性。尽管用于现实世界图像的生成AI的快速发展，但医学领域的评估受到方法论上的不一致，过时的结构比较和断开评估标准的阻碍，这些评估标准很少解决合成样本的实际临床价值。 Chexgenbench通过标准化的数据分配和一个统一的评估协议来克服这些局限性，其中包括20个定量指标，这些定量指标可以系统地分析发电质量，潜在的隐私脆弱性以及在11个领先的文本形象到图像架构中的下游临床适用性 ...

0 0 0 0 2025/06/20 arXiv:2505.10496v2 happylittleqiang

Boosting Reward Model with Preference-Conditional Multi-Aspect Synthetic Data Generation

3D human pose estimation in video with temporal convolutions and semi-supervised training

CLONE: Closed-Loop Whole-Body Humanoid Teleoperation for Long-Horizon Tasks

Align Attention Heads Before Merging Them: An Effective Way for Converting MHA to GQA

TAROT: Targeted Data Selection via Optimal Transport

CheXGenBench: A Unified Benchmark For Fidelity, Privacy and Utility of Synthetic Chest Radiographs

Xinyu AI Search: Enhanced Relevance and Comprehensive Results with Rich Answer Presentations

NeurIPS 2025 E2LM Competition : Early Training Evaluation of Language Models

From Paraphrasing to Semantic Parsing: Unsupervised Semantic Parsing via Synchronous Semantic Decoding

A Strategic Coordination Framework of Small LLMs Matches Large LLMs in Data Synthesis

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您在阅读时勇敢地改正翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）