arxiv的文档

arxiv 南京

个性签名 ...

Sequence-to-Sequence Neural Diarization with Automatic Speaker Detection and Representation

本文提出了一个新型的序列到序列神经读物（S2SND）框架，以在线和离线扬声器诊断。它是从我们以前的目标扬声器语音活动检测系统的序列到序列架构开发的，然后通过解决两个关键问题而演变为新的诊断范式。 1）扬声器检测：拟议的方法可以利用部分给出的扬声器嵌入来发现未知的说话者并预测音频信号中的目标语音活动 ...

0 0 0 0 2025/06/30 arXiv:2411.13849v2 takkeri

Brame: Hierarchical Data Management Framework for Cloud-Edge-Device Collaboration

在大数据领域中，云边缘设备合作在工业场景中很普遍。但是，缺乏对与该领域数据管理相关的理论和方法的系统探索。本文深入研究了云边缘设备协作环境中数据存储和调度的子问题 ...

0 0 0 0 2025/06/30 arXiv:2502.08331v1 yiweima

Tweedie Regression for Video Recommendation System

现代推荐系统旨在通过通常将排名作为一项针对预测CTR的分类任务来提高点击率（CTR）以获得更好的用户体验。但是，这种方法与跨不同领域的企业的实际目标之间存在差距。在视频推荐服务中，视频按需（VOD）的目标扩展到了仅仅鼓励点击的范围，而且还指导用户发现他们的真正兴趣，从而增加了观看时间 ...

0 0 0 0 2025/06/30 arXiv:2505.06445v1 xuwenlong

TEMPLE:Temporal Preference Learning of Video LLMs via Difficulty Scheduling and Pre-SFT Alignment

视频大型语言模型（视频LLM）通过利用两阶段范式来取得了重大成功：在大规模视频文本数据上进行审计，以进行视觉语言对齐，然后进行监督的微调（SFT），以获得特定于任务的功能。但是，由于数据中的时间对应关系弱，并且在培训期间对下一步的预测范式的依赖，现有方法与时间推理困难。为了解决这些局限性，我们提出了Temple（时间偏好学习），这是一个系统的框架，可通过直接偏好优化（DPO）增强Video LLMS的时间推理功能 ...

0 0 0 0 2025/06/30 arXiv:2503.16929v2 advise2009899

Does quantization affect models' performance on long-context tasks?

现在，大型语言模型（LLMS）支持上下文窗口超过128K Token ，但这带有大量的内存需求和高推理延迟。量化可以减轻这些成本，但可能会降低性能。在这项工作中，我们在具有长输入（> 64K Token ）和长形输出的任务上介绍了对量化LLM的第一个系统评估 ...

0 0 0 0 2025/06/30 arXiv:2505.20276v2 felixslu

ROSAQ: Rotation-based Saliency-Aware Weight Quantization for Efficiently Compressing Large Language Models

量化已被广泛研究为减少大语言模型（LLM）的记忆需求的有效技术，从而有可能改善潜伏时间。利用 Transformer 旋转不变性的特征，我们提出了基于旋转的显着性权重量化（Rosaq），该量化标识了投影特征空间中的显着通道，而不是在原始特征空间中，其中投影的“主体”尺寸自然被视为“显着”特征。拟议的ROSAQ由1）基于PCA的投影组成，该预测首先在校准集上执行主要成分分析（PCA），并通过PCA投影进行转换，2）显着通道牙齿牙齿化，选择与k最大特征值相对应的尺寸，并将其作为较高的eigenvalueres和3）用于混合量的forcision and 3）。方面 ...

0 0 0 0 2025/06/30 arXiv:2506.13472v2 xiximayou

Sequence-to-Sequence Neural Diarization with Automatic Speaker Detection and Representation

Brame: Hierarchical Data Management Framework for Cloud-Edge-Device Collaboration

Tweedie Regression for Video Recommendation System

TEMPLE:Temporal Preference Learning of Video LLMs via Difficulty Scheduling and Pre-SFT Alignment

Does quantization affect models' performance on long-context tasks?

ROSAQ: Rotation-based Saliency-Aware Weight Quantization for Efficiently Compressing Large Language Models

Multi-Channel Sequence-to-Sequence Neural Diarization: Experimental Results for The MISP 2025 Challenge

Comparing Propensity Score-Based Methods in Estimating the Treatment Effects: A Simulation Study

Rerandomization to improve covariate balance in experiments

FlexQuant: A Flexible and Efficient Dynamic Precision Switching Framework for LLM Quantization

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您在阅读时勇敢地改正翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）