fcqfcq的文档

fcqfcq

个性签名 ...

Universally Quantized Neural Compression

一种流行的学习编码器方法是有损压缩的方法，是在训练过程中使用添加剂均匀的噪声作为测试时间量化的可区分近似值。我们证明，也可以使用通用量化在测试时间实现均匀的噪声通道（ZIV，1985）。这使我们能够消除训练阶段和测试阶段之间的不匹配，同时保持完全可区分的损失函数 ...

0 0 0 0 2025/03/16 arXiv:2006.09952v2 fcqfcq

Low-complexity Overfitted Neural Image Codec

我们在降低的复杂性下提出了一个神经图像编解码器，该编解码器过多地将解码器参数归入每个输入图像。尽管自动编码器的每个解码像素的执行量高达100万个乘法，但所提出的方法仅需要每个像素的2300个乘法。尽管低复杂性，该方法与自动编码器的性能相媲美，并在各种编码条件下超过了HEVC性能 ...

0 0 0 0 2025/03/13 arXiv:2307.12706v1 fcqfcq

Nonlinear Transform Coding

我们审查了一类可根据名称非线性转换编码（NTC）收集的方法，在过去的几年中，这些方法已与图像的最佳线性变换编解码器竞争，并以速率（在既定的感知质量质量指标（例如MS-SSIM））（如MS-SSIM）的速率绩效取代了它们。我们评估了经验率 - 借助于简单的示例来源，NTC的延伸性能是，矢量量化器的最佳性能比自然数据源更容易估计。为此，我们引入了一种新型的熵受限矢量量化的变体 ...

0 0 0 0 2025/03/03 arXiv:2007.03034v2 fcqfcq

Controlling Rate, Distortion, and Realism: Towards a Single Comprehensive Neural Image Compression Model

近年来，神经网络驱动的图像压缩（NIC）引起了广泛的关注。一些作品采用深度生成模型（例如 GAN 和扩散模型）来增强感知质量（真实感）。这些生成 NIC 方法的一个关键障碍是每个模型都针对单个比特率进行了优化 ...

0 0 0 0 2025/01/22 arXiv:2405.16817v1 fcqfcq

C3: High-performance and low-complexity neural compression from a single image or video

大多数神经压缩模型都是在大型图像或视频数据集上进行训练，以便泛化到不可见的数据。这种泛化通常需要具有高解码复杂性的大型且富有表现力的架构。在这里，我们介绍 C3，一种具有强大率失真 (RD) 性能的神经压缩方法，它会分别对每个图像或视频过度拟合一个小模型 ...

0 0 0 0 2025/01/04 arXiv:2312.02753v1 fcqfcq

Differentiable JPEG: The Devil is in the Details

JPEG 仍然是最广泛使用的有损图像编码方法之一。然而，JPEG 的不可微性质限制了深度学习管道中的应用。最近提出了几种可微分的 JPEG 近似来解决这个问题 ...

0 0 0 0 2024/11/30 arXiv:2309.06978v4 fcqfcq

Human Pose Regression with Residual Log-likelihood Estimation

基于热图的方法通过似然热图对输出分布进行建模，在人体姿态估计领域占据主导地位。相比之下，基于回归的方法更有效，但性能较差。在这项工作中，我们探索最大似然估计（MLE）来开发一种高效且有效的基于回归的方法 ...

0 0 1 3 2024/11/18 arXiv:2107.11291v3 fcqfcq

Context Autoencoder for Self-Supervised Representation Learning

我们提出了一种新颖的掩模图像建模（MIM）方法，即上下文自动编码器（CAE），用于自监督表示预训练。我们通过在编码表示空间中进行预测来预训练编码器。预训练任务包括两个任务：掩码表示预测 - 预测掩码补丁的表示，以及掩码补丁重建 - 重建掩码补丁 ...

0 0 0 0 2024/08/16 arXiv:2202.03026v3 fcqfcq