一译 —— 文档和论文翻译、对照阅读、讨论和社区

DiffSTG: Probabilistic Spatio-Temporal Graph Forecasting with Denoising Diffusion Models

（STGNN）（STG）预测的主导模型。尽管取得了成功，但他们未能对 ...

0 0 0 2025/04/06 arXiv:2301.13629v4 zcx

TransVG++: End-to-End Visual Grounding with Language Conditioned Vision Transformer

在这项工作中，我们探索了用于视觉接地的整洁而有效的基于 Transformer 的框架。先前的方法通常解决了视觉接地的核心问题，即 ...

0 0 0 2025/04/06 arXiv:2206.06619v1 chengwenxuan7

From Zero to Turbulence: Generative Modeling for 3D Flow Simulation

3D中湍流的模拟是计算流体动力学（CFD）中最昂贵的模拟之一。已经写了许多关于代孕模型的作品，以更快，学习，自回归模型代替流体流量的数值求解器。但是，三个维度的湍流的复杂性需要以很小的时间步长训练这些模型，同时产生逼真的流量状态需要长时间的滚动，并从许多步骤和大量误差积累或从已知的现实流动状态开始 - 我们首先要避免这种情况 ...

0 0 0 2025/04/06 arXiv:2306.01776v3 xiaochao

L2-constrained Softmax Loss for Discriminative Face Verification

近年来，使用深层卷积神经网络（DCNN），面部验证系统的性能显着改善。典型的面部验证管道包括训练一个深层网络，以使用倒数第二层输出作为特征描述符，并在给定面部图像的情况下，使用倒数第二层输出作为特征描述符，并生成余弦相似性得分。 SoftMax损耗函数不会优化功能，以使正对具有较高的相似性评分，而负面对的相似性得分较低，从而导致性能差距 ...

0 0 0 2025/04/06 arXiv:1703.09507v3 ReLU

VideoCon: Robust Video-Language Alignment via Contrast Captions

尽管接受了大量数据的培训，但最先进的视频对齐模型对于视频字幕上语义上可视的对比度变化并不强大。我们的工作通过确定广泛的对比度未对准（例如更换实体，行动和翻转事件顺序）来解决这一问题，该订单模型应与之稳健。为此，我们介绍了Videocon，这是一个由大型语言模型构建的视频语言对齐数据集，该数据集生成了合理的对比视频字幕，并解释了原始视频和对比度视频字幕之间的差异 ...

0 0 0 2025/04/06 arXiv:2311.10111v1 2889932594

Going Deeper Into Face Detection: A Survey

面部检测是许多面部识别和面部分析系统的关键第一步。早期的面部检测方法主要基于基于从本地图像区域提取的手工制作的特征（例如HAAR级联反应和定向梯度的直方图）构建的分类器。但是，这些方法不足以实现不受控制环境的图像的高度准确性 ...

0 0 0 2025/04/06 arXiv:2103.14983v2 ReLU

AskToAct: Enhancing LLMs Tool Use via Self-Correcting Clarification

大型语言模型（LLM）在工具学习中表现出了显着的功能。在实际情况下，用户查询通常是模棱两可和不完整的，需要有效的澄清。但是，现有的交互式澄清方法面临两个关键局限性：依赖手动构造的数据集以及在多转移澄清过程中缺乏误差校正机制 ...

0 0 0 2025/04/06 arXiv:2503.01940v1 liuweitang

Restoring Vision in Adverse Weather Conditions with Patch-Based Denoising Diffusion Models

在不利天气条件下的图像恢复对各种计算机视觉应用引起了重大兴趣。最近的成功方法取决于深度神经网络建筑设计的当前进展（例如 ...

0 0 0 2025/04/06 arXiv:2207.14626v2 Veggie

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）