一译 —— 文档和论文翻译、对照阅读、讨论和社区

Revealing the Invisible with Model and Data Shrinking for Composite-database Micro-expression Recognition

复合数据库的微表达识别引起了人们越来越多的关注，因为它对现实世界的应用更为实用。尽管复合数据库为学习良好的表示模型提供了更多的样本多样性，但重要的微妙动力很容易消失在域移动中，以使模型极大地降低了其性能，尤其是对于深层模型。在本文中，我们分析了学习复杂性的影响，包括输入复杂性和模型复杂性，并发现较低分辨率的输入数据和较浅的体系结构模型有助于缓解复合数据库任务中深层模型的降级 ...

0 0 0 2025/04/08 arXiv:2006.09674v1 uuu1012

Rethinking Medical Report Generation: Disease Revealing Enhancement with Knowledge Graph

知识图（KG）在医学报告生成（MRG）中起着至关重要的作用，因为它揭示了疾病之间的关系，因此可以用来指导生成过程。但是，建造全面的公斤是劳动密集型的，其在MRG过程中的应用不足。在这项研究中，我们在胸部X射线成像上建立了一个完整的kg，其中包括137种类型的疾病和异常 ...

0 0 0 2025/04/08 arXiv:2307.12526v1 aaatuzi

O-TPT: Orthogonality Constraints for Calibrating Test-time Prompt Tuning in Vision-Language Models

测试时间及时调整视觉模型（VLMS）正在引起人们的注意，因为它们可以使用未标记的数据学习而无需微调。尽管VLMS的测试时间及时调整方法可以提高准确性，但所得模型倾向于表现出较差的校准，这对这些模型的可靠性和可信度表示怀疑。值得注意的是，需要更多的注意力用于校准视觉模型中的测试时间及时调整 ...

0 0 0 2025/04/08 arXiv:2503.12096v1 likelc

Align to Structure: Aligning Large Language Models with Structural Information

对于大型语言模型（LLM）来说，生成长而连贯的文本仍然是一个挑战，因为它们缺乏层次结构计划和在话语产生中的结构性组织。我们介绍了结构对齐，这是一种新颖的方法，将LLM与人类的话语结构保持一致，以增强长篇文本生成。通过将语言基础的话语框架整合到加强学习中，我们的方法指导模型以产生连贯且组织良好的产出 ...

0 0 0 2025/04/08 arXiv:2504.03622v1 liuweitang

Lipschitz Constant Meets Condition Number: Learning Robust and Compact Deep Neural Networks

最近的研究表明，深度神经网络（DNN）的高压，例如，DNN的重量基质的大量修剪会导致准确性和对对抗攻击的敏感性严重下降 ...

0 0 0 2025/04/08 arXiv:2503.20454v1 odenkkk

Evolution 6.0: Evolving Robotic Capabilities Through Generative Design

我们提出了一个新概念，即Evolution 6.0，它代表了由生成AI驱动的机器人技术的演变。当机器人缺乏完成人类要求的任务的必要工具时，它会自主设计所需的工具并学习如何使用它们来实现目标 ...

0 0 0 2025/04/08 arXiv:2502.17034v4 蔡明方

Adaptive Domain Learning for Cross-domain Image Denoising

不同的摄像头传感器具有不同的噪声模式，因此在一个传感器上训练的图像denoing模型通常不会很好地推广到其他传感器。一个合理的解决方案是为每个传感器收集一个大型数据集，以进行训练或微调，这不可避免地耗时。为了应对这一跨域挑战，我们提出了一种新颖的自适应域学习（ADL）方案，用于通过利用来自不同传感器（源域）的现有数据加上新传感器（目标域）的少量数据，以跨域原始图像进行降级 ...

0 0 0 2025/04/08 arXiv:2411.01472v1 ZeHeru

NESTFUL: A Benchmark for Evaluating LLMs on Nested Sequences of API Calls

由大型语言模型 (LLM) 支持的自主代理应用程序最近作为解决复杂的现实世界任务的有效工具而受到关注。代理工作流程的核心是依赖 LLM 来计划和执行工具和外部应用程序编程接口 (API) 的使用顺序，以获得用户请求的答案。已经出现了各种基准和排行榜来评估 LLM 使用工具和 API 的能力；然而，大多数这些评估仅跟踪单个或多个独立的 API 调用能力 ...

0 0 0 2025/04/08 arXiv:2409.03797v2 chrisxiong

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）