一译 —— 文档和论文翻译、对照阅读、讨论和社区

LiveForesighter: Generating Future Information for Live-Streaming Recommendations at Kuaishou

作为联系用户和作者的新一代媒体，现场直播吸引了很多关注，并且近年来经历了快速增长。与内容静态短视频建议相比，实时流程的建议在给用户带来令人满意的体验方面面临更多挑战：（1）直播内容随着时间的流逝而动态地变化。 （2）有价值的行为（e ...

0 0 0 2025/02/25 arXiv:2502.06557v1 hokirn

Geometric Deep Learning: Grids, Groups, Graphs, Geodesics, and Gauges

过去十年见证了数据科学和机器学习的实验革命，这是通过深度学习方法体现的。实际上，实际上，具有适当的计算量表，许多以前被认为是无法触及的高维学习任务（例如计算机视觉，玩游戏或蛋白质折叠）是可行的。值得注意的是，深度学习的本质是从两种简单的算法原则中构建的：首先，表示代表或特征学习的概念，通过这些概念（通常是层次结构）为每个任务捕获适当的规律性概念，其次是本地渐变 - 下降类型方法，通常以反向传播实现 ...

0 0 0 2025/02/25 arXiv:2104.13478v2 chenkx

OmniHuman-1: Rethinking the Scaling-Up of One-Stage Conditioned Human Animation Models

端到端的人类动画，例如音频驱动的人类一代，在最近几年中取得了显着的进步。但是，现有的方法仍然很难扩大作为大型一般视频生成模型的扩展，从而限制了它们在实际应用中的潜力。在本文中，我们提出了Omnihuman，这是一种基于扩散 Transformer 的框架，可通过将与运动相关条件混合到训练阶段来扩展数据 ...

0 0 0 2025/02/25 arXiv:2502.01061v2 tiandiweizun

Structured Chain-of-Thought Prompting for Code Generation

大型语言模型（LLMS）（例如ChatGpt）在代码生成中表现出令人印象深刻的性能 ...

0 0 0 2025/02/25 arXiv:2305.06599v3 15966829631

ACECODER: Acing Coder RL via Automated Test-Case Synthesis

最近的编码器模型中的大多数进展是由监督的微调（SFT）驱动的，而强化学习的潜力（RL）仍然在很大程度上没有开发，这主要是由于代码域中缺乏可靠的奖励数据/模型。在本文中，我们通过利用自动大规模测试案例合成来提高代码模型培训来应对这一挑战。具体而言，我们设计了一条管道，该管道从现有代码数据中生成广泛的（问题，测试案例）对 ...

0 0 0 2025/02/25 arXiv:2502.01718v3 tboy

BFS-Prover: Scalable Best-First Tree Search for LLM-based Automatic Theorem Proving

大型语言模型（LLMS）的最新进展激发了人们对使用Lean4证明自动定理的日益兴趣，在这种情况下，有效的树搜索方法对于浏览基础大型证明搜索空间至关重要。尽管现有方法主要依赖于价值函数和/或蒙特卡洛树搜索（MCT），但更简单的方法的潜力（例如最佳优先树搜索（BFS））仍未得到充实。在本文中，我们研究了BFS是否可以在大规模定理证明任务中实现竞争性能 ...

0 0 0 2025/02/25 arXiv:2502.03438v2 YONG

MixSTE: Seq2seq Mixed Spatio-Temporal Encoder for 3D Human Pose Estimation in Video

通过考虑全球所有框架之间的身体接头以学习时空相关性，已引入了最近基于 Transformer 的解决方案，以估算2D关键点序列的3D人姿势。我们观察到不同关节的运动有很大差异。但是，先前的方法无法有效地对每个关节的固体间相对应关系进行建模，从而导致对时空相关性的学习不足 ...

0 0 0 2025/02/25 arXiv:2203.00859v4 yanyu

General Facial Representation Learning in a Visual-Linguistic Manner

如何学习一种可以提高所有面部分析任务的通用面部表现？本文朝着这个目标迈出了一步。在本文中，我们在面部分析任务上研究了预训练模型的转移性能，并以视觉语言的方式引入了一个称为Farl的框架，以进行一般面部表示学习。一方面，该框架涉及从图像文本对学习高级语义含义的对比损失 ...

0 0 0 2025/02/25 arXiv:2112.03109v3 mm1111111111111111111

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）