一译 —— 文档和论文翻译、对照阅读、讨论和社区

Token Compensator: Altering Inference Cost of Vision Transformer without Re-Tuning

 Token 压缩通过减少冗余 Token 的数量，例如修剪注意力不集中的 Token 或合并类似 Token 来加快视力 Transformer （VIT）的训练和推断 ...

0 0 0 2025/04/26 arXiv:2408.06798v1 link.yu

Deep Whole-Body Control: Learning a Unified Policy for Manipulation and Locomotion

附着的手臂可以显着提高腿部机器人在几个移动操作任务上的适用性，而车轮或轨道对应物不可能。这种腿部操纵器的标准层次控制管道是将控制器解散到操作和运动的情况下。但是，这是无效的 ...

0 0 0 2025/04/26 arXiv:2210.10044v1 小胖猴

This Paper Had the Smartest Reviewers -- Flattery Detection Utilising an Audio-Textual Transformer-Based Approach

奉承是人类交流的一个重要方面，它可以通过战略的称赞和赞美来促进社会联系，塑造观念并影响行为，从而利用言论的力量有效地建立融洽的关系。因此，它的自动检测可以增强人类相互作用的自然性。为了满足这种需求，我们提出了一个新颖的音频文本数据集，其中包括20个小时的语音和机器学习模型，用于自动奉承 ...

0 1 0 2025/04/26 arXiv:2406.17667v1 liuzhanbo-intern

HMPE:HeatMap Embedding for Efficient Transformer-Based Small Object Detection

当前基于 Transformer 的小物体检测方法继续出现，但它们仍然表现出重大的缺点。本文介绍了Heatmap位置嵌入（HMPE），这是一种新型的 Transformer 优化技术，通过通过热图指导自适应的自适应将HTTP URL动态地整合到语义检测信息来增强对象检测性能，并创新了HMPE方法，从而可以可视化HMPE，从而为您提供了可视化的信息，从而为远距离提供了远距离的范围，然后均可用来乘坐H ...

0 0 0 2025/04/26 arXiv:2504.13469v1 Ojuice

Progent: Programmable Privilege Control for LLM Agents

LLM代理是AI系统的一种新兴形式，其中大型语言模型（LLMS）用作中心组件，利用各种工具来完成用户分配的任务。尽管具有巨大的潜力，但LLM代理商构成了重大的安全风险。与外部世界互动时，他们可能会遇到攻击者的恶意命令，从而导致执行危险行动 ...

0 0 1 2025/04/26 arXiv:2504.11703v1 dropout

HairCLIP: Design Your Hair by Text and Reference Image

在计算机视觉和图形中，头发编辑是一个有趣且具有挑战性的问题。许多现有的方法需要精心绘制的草图或口罩作为用于编辑的条件输入，但是这些相互作用既不简单又有效。为了使用户摆脱乏味的交互过程，本文提出了一种新的头发编辑交互模式，该模式可以根据用户提供的文本或参考图像单独或共同操纵头发属性 ...

0 0 0 2025/04/26 arXiv:2112.05142v2 jecc

SDSTrack: Self-Distillation Symmetric Adapter Learning for Multi-Modal Visual Object Tracking

多模式的视觉对象跟踪（fot）由于其稳健性最近引起了极大的关注。早期研究的重点是完全微调的基于RGB的跟踪器，该跟踪器效率低下，由于多模式数据的稀缺而缺乏广义表示。因此，最近的研究利用迅速调整将基于RGB的预训练的跟踪器转移到多模式数据 ...

0 0 0 2025/04/26 arXiv:2403.16002v2 keqi

DeepDistill: Enhancing LLM Reasoning Capabilities via Large-Scale Difficulty-Graded Data Training

尽管大型语言模型（LLMS）最近在各种复杂的推理基准上取得了出色的表现，但学术界仍然缺乏对基本模型培训过程和数据质量的深入了解。为了解决这个问题，我们构建了一个大规模的，难以分级的推理数据集，其中包含大约334亿个不同难度水平的独特查询以及多个通过多个通过的多个模型产生的大约4000万个蒸馏响应 ...

0 0 0 2025/04/26 arXiv:2504.17565v1 chrisxiong

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）