一译 —— 文档和论文翻译、对照阅读、讨论和社区

You Only Need One Color Space: An Efficient Network for Low-light Image Enhancement

低光图像增强（LLIE）任务倾向于恢复损坏的低光图像的细节和视觉信息。大多数现有方法通过SRGB和HSV颜色空间上的深神经网络（DNN）学习低/正常光图像之间的映射函数。然而，增强涉及放大图像信号，并将这些颜色空间应用于具有低信噪比比率的低光图像，可以将灵敏度和不稳定性引入增强过程中 ...

0 0 0 2025/03/16 arXiv:2402.05809v3 tuxiaolv

SkyServe: Serving AI Models across Regions and Clouds with Spot Instances

近年来，AI模型的爆炸性增长。在GPU及其苛刻的服务要求上托管AI服务的高昂成本，使其及时且具有挑战性，以降低服务成本并保证服务质量。尽管长期以来一直为现场实例提供了很大的折扣，但现场先发制人阻止用户在服务AI模型时使用它们来主机模型复制品 ...

0 0 0 2025/03/16 arXiv:2411.01438v2 anhao

Finch: Prompt-guided Key-Value Cache Compression

最近的大型语言模型应用程序，例如检索型生成和聊天机器人，导致了处理更长的输入上下文的需求。但是，这一要求受到固有的局限性的阻碍。在架构上，模型受到训练期间定义的上下文窗口的约束 ...

0 0 0 2025/03/16 arXiv:2408.00167v2 zye

FastKV: KV Cache Compression for Fast Long-Context Processing with Token-Selective Propagation

尽管大型语言模型（LLMS）在处理长篇小说序列方面表现出色，但它们需要大量的键值（KV）缓存来存储上下文信息，这可以使负担重大的计算效率和内存使用情况。以前的压缩这些KV缓存的努力主要集中于减少记忆需求，但在提高延迟方面受到限制。为了解决此问题，我们介绍了FastKV，这是一种KV缓存压缩方法，旨在增强长篇文本序列的延迟 ...

0 0 0 2025/03/16 arXiv:2502.01068v1 zye

Cache Me If You Must: Adaptive Key-Value Quantization for Large Language Models

大型语言模型（LLMS）的有效实际部署依赖键值（KV）缓存来处理和生成长输出，从而减少了重复计算的需求。对于庞大的上下文，键值库可以占用数十GB的设备内存，因为它们为每个 Token 和层存储向量表示。最近的工作表明，缓存的向量可以通过量化，修剪或合并来压缩，但是这些技术通常会损害质量降低较高的压缩率 ...

0 0 0 2025/03/16 arXiv:2501.19392v4 zye

RetrievalAttention: Accelerating Long-Context LLM Inference via Vector Retrieval

基于 Transformer 的大型语言模型 (LLM) 变得越来越重要。然而，由于注意力计算的二次时间复杂度，将 LLM 扩展到更长的上下文会导致推理延迟极慢，并且用于缓存键值 (KV) 向量的 GPU 内存消耗很高。本文提出了 RetrievalAttention，这是一种无需训练的方法，可以加速注意力计算并减少 GPU 内存消耗 ...

0 0 0 2025/03/16 arXiv:2409.10516v3 zye

Schedule On the Fly: Diffusion Time Prediction for Faster and Better Image Generation

扩散和流匹配模型在文本到图像生成方面取得了显着的成功。但是，这些模型通常依赖于所有提示的预先确定的DeNoising计划。多步反向扩散过程可以被视为一种逐步生成高质量图像的思想链 ...

0 0 0 2025/03/16 arXiv:2412.01243v3 iris

FgC2F-UDiff: Frequency-guided and Coarse-to-fine Unified Diffusion Model for Multi-modality Missing MRI Synthesis

多模式磁共振成像（MRI）对于诊断和治疗脑肿瘤至关重要。但是，由于扫描时间的限制，扫描腐败，伪影，运动和对比剂不耐受，通常观察到缺失的方式。缺失MRI的综合是解决临床实践和研究中形态不足的局限性的一种手段 ...

0 0 0 2025/03/16 arXiv:2501.03526v1 guyxlous

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）