观看时间广泛用作视频推荐平台中用户满意度的代理。但是,原始手表时间受到混杂因素的影响,例如视频持续时间,受欢迎程度和个人用户行为,可能会扭曲偏好信号,并导致偏见的建议模型。我们提出了一个新颖的相对优势偏见框架,该框架通过将观察时间与以用户和项目组为条件的经验得出的参考分布进行比较来纠正观察时间 ...

0 0 0 0 2025/08/19 arXiv:2508.11086v1 yqstar

强化学习(RL)已成为对复杂推理任务进行微调大语模型(LLM)的流行方法。在最近的方法中,GRPO在诸如DeepSeek-R1之类的培训模型中取得了成功,但其有效性的来源仍然很少理解。在这项工作中,我们从类似增强的算法的角度重新访问GRPO并分析其核心组成部分 ...

0 0 0 0 2025/08/19 arXiv:2504.11343v2 十门山几

视频字幕在文本到视频生成任务中起着至关重要的作用,因为它们的质量直接影响了生成视频的语义连贯性和视觉保真度。尽管大型视觉模型(VLM)在字幕生成中表现出了巨大的潜力,但现有的基准不足解决了细粒度的评估,尤其是在捕获视频生成至关重要的时空细节时。为了解决这一差距,我们介绍了细粒度的视频标题评估基准(VCAPSBENCE),这是第一个大规模细粒基准,其中包括5,677(5k+)视频和109,796(100k+)问题 - 答案对 ...

0 0 0 0 2025/08/19 arXiv:2505.23484v1 zhangqi33

基于图的近似近似邻居搜索(ANN)算法在大规模矢量检索上有效地工作。在这种方法中,Diskann使用DRAM和存储实现了良好的召回速度权衡。 Diskann采用产品量化(PQ)来减少内存使用情况,这仍然与数据集的规模成正比 ...

0 0 0 0 2025/08/19 arXiv:2404.06004v2 Uncroyable

我们介绍了HumanEdit,这是一种专门设计的高质量的人为奖励数据集,该数据集专门设计用于指导引导的图像编辑,通过开放形式的语言说明实现了精确而多样的图像操作。以前的大规模编辑数据集经常结合最少的人类反馈,从而导致挑战与人类偏好相结合。 Humanedit通过使用人类注释来构建数据对和管理员来提供反馈来弥合这一差距 ...

0 0 0 0 2025/08/19 arXiv:2412.04280v2 f48835468

Transformer 已被确定为序列建模中最受欢迎的骨干,这主要是由于它们在内在检索任务中的有效性和大规模学习能力。然而,他们的二次记忆和时间复杂性将其适用性限制在更长的序列中,因此激发了研究人员探索有效的替代体系结构,例如现代复发性神经网络(A.K. ...

0 0 0 0 2025/08/19 arXiv:2505.23735v1 hwrabbit

随着视觉语言模型(VLM)的快速发展,它们基于特定标准和维度评估视觉内容的能力已经变得越来越重要,例如视频主题一致性评估和视觉质量评分等应用程序。但是,现有方法通常会遭受不精确的结果和效率低下的损失计算,这将模型的重点限制在关键评估指标上。为了解决这个问题,我们提出了IOVQA(仅Integer-folly VQA),这是一种针对VLMS量身定制的新颖的微调方法,可增强其在视频质量评估任务中的性能 ...

0 0 0 0 2025/08/19 arXiv:2508.11170v1 haoyi199815

图像,尤其是具有高分辨率的图像,通常由许多视觉元素组成,从主导的大物体到细粒的详细对象。当感知此类图像时,多模式的大语言模型〜(MLLM)由于预验证的视觉编码的输入分辨率而面临限制,图像的杂乱无章的密集上下文,导致着眼于主体,同时易于忽略详细的对象。在本文中,我们提出了Zoom Eye,这是一种旨在浏览图像的层次结构和视觉性质以捕获相关信息的树木搜索算法 ...

0 0 0 0 2025/08/19 arXiv:2411.16044v1 translater

由于外观和瞬态遮挡,无约束图像收集的3D重建提出了重大挑战。在本文中,我们介绍了基于微型麦克罗小波的高斯脱落(MW-GS),这是一种新颖的方法,旨在通过将场景表示形式分解为全局,精制和内在组件来增强3D重建。所提出的方法具有两个关键创新:微麦克罗投影,它允许高斯点从具有增强多样性的多个尺度上捕获特征地图的细节;和基于小波的采样,它利用频域信息来完善特征表示形式,并显着改善场景外观的建模 ...

0 0 0 0 2025/08/18 arXiv:2501.14231v1 zhanguanglun

人工智能的激增,尤其是大型语言模型,推动了大型机器学习群集的快速发展。在这些集群上执行分布式模型通常受到通信开销的限制,从而有效利用可用的网络资源至关重要。结果,用于集体通信的路由算法(i ...

0 0 0 0 2025/08/18 arXiv:2304.05301v3 白日衣衫尽

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)