一译 —— 文档和论文翻译、对照阅读、讨论和社区

KVShare: Semantic-Aware Key-Value Cache Sharing for Efficient Large Language Model Inference

本文介绍了基于语义相似性的多用户键值（KV）缓存共享技术的KVShare，旨在提高大语言模型（LLMS）和多模式大语言模型（MLLMS）的推理效率。 KVShare解决了现有前缀缓存（严格的文本前缀匹配）和语义缓存（响应多样性的丧失）的局限性，通过语义对齐算法和差分编辑操作，KVShare实现了细粒度的KV缓存重复使用。现实世界中用户对话数据集的实验表明，KVShare将KV Cache HIT率 ...

0 0 0 2025/04/17 arXiv:2503.16525v1 yli

Low-rank constrained multichannel signal denoising considering channel-dependent sensitivity inspired by self-supervised learning for optical fiber sensing

光纤传感是一项技术，使用光纤检测到音频，振动和温度。尤其是音频/振动感知的传感称为分布式声传感（DAS）。在DAS中，由于光学噪声或安装方法，观察到的数据由多通道数据组成，遭受了严重的噪声水平。在用于降级DAS数据的常规方法中，已经研究了信号处理或深神经网络（DNN）模型 ...

0 0 0 2025/04/17 arXiv:2312.08660v2 YONG

BitNet b1.58 2B4T Technical Report

我们以200亿个参数量表介绍了B1.58 2B4T，这是第一个开源的，本机1位大语言模型（LLM）。该模型受过4万亿 Token 的语料库的培训，对涵盖语言理解，数学推理，编码能力和对话能力的基准进行了严格评估 ...

0 0 0 2025/04/17 arXiv:2504.12285v1 felixslu

Robust Visual Tracking by Segmentation

估计目标范围在视觉对象跟踪中构成了基本挑战。通常，跟踪器以箱子为中心，并且完全依靠一个边界框来定义场景中的目标。实际上，对象通常具有复杂的形状，并且与图像轴不符 ...

0 0 0 2025/04/17 arXiv:2203.11191v2 Eve_Any

Vul-RAG: Enhancing LLM-based Vulnerability Detection via Knowledge-level RAG

脆弱性检测对于软件质量保证至关重要。近年来，深度学习模型（尤其是大型语言模型）在脆弱性检测中表现出了希望。在这项工作中，我们提出了一种基于LLM的新型脆弱性检测技术vul-rag，该技术利用知识级检索 - 调格生成（RAG）框架在三个阶段中检测给定代码的脆弱性 ...

0 0 0 2025/04/17 arXiv:2406.11147v2 jiang

Improving LLM-as-a-Judge Inference with the Judgment Distribution

使用语言模型可缩减对文本质量的人类偏好（LLM-AS-A-Gudge）已成为适用于许多任务的标准实践。通常仅从法官的文本输出中提取判断，通常是贪婪的解码。但是，LLM法官自然会在判断 Token 上提供分布，邀请推理方法广度以提取细粒度的偏好 ...

0 0 5 2025/04/17 arXiv:2503.03064v1 jueli

An Efficient Deep Distribution Network for Bid Shading in First-Price Auctions

自2019年以来，在线广告行业中的大多数广告交易所和卖方平台（SSP）从第二次价格拍卖转移到了第一笔价格。由于这些拍卖之间的根本差异，需求端平台（DSP）不得不更新其竞标策略，以避免不必要地竞标不必要的高价，从而超额付款。提出了出价阴影来调整用于第二价格拍卖的投标价格，以平衡成本和首价拍卖设置中的概率 ...

0 0 0 2025/04/17 arXiv:2107.06650v2 caowenli

VGDFR: Diffusion-based Video Generation with Dynamic Latent Frame Rate

基于扩散的 Transformer （DIT）的生成模型在视频生成中取得了巨大的成功。但是，它们固有的计算需求构成了巨大的效率挑战。在本文中，我们利用了现实世界视频的固有时间不均匀性，并观察到视频表现出动态信息密度，高动片段比静态场景更需要更大的详细信息 ...

0 0 0 2025/04/17 arXiv:2504.12259v1 wenzhanwujian

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）