大型语言模型(LLMS)的最新进展为通过利用测试时间计算而创造了新的机会来增强复杂推理任务的性能。但是,除了需要昂贵的特定于任务的奖励模型培训外,诸如以多数投票或奖励模型评分的重复采样或奖励模型评分等传统方法通常会降低。在本文中,我们提出了自我增强的测试时间缩放(集合),这是一种利用最近晚期LLM的自我验证和自我纠正能力来克服这些局限性的新方法 ...
0 0 0 2025/02/17 arXiv:2501.19306v2 leec
随着对更多个性化建议的需求不断增长,并且在商业场景中产生了巨大的繁荣,多幕科建议(MSR)的研究引起了很多关注,该研究使用了所有方案的数据,以同时提高其建议性能。但是,现有的方法倾向于整合场景知识不足和忽视学习个性化的跨阵营偏好,从而导致次优性能和不足的解释性。同时,尽管大型语言模型(LLM)表现出很大的推理和捕获语义信息的能力,但调整的高推理潜伏期和高计算成本阻碍了其在工业推荐系统中的实现 .. ...
0 0 0 2025/02/17 arXiv:2406.12529v1 tim
模拟为学习视觉机器人策略提供了可扩展有效的替代方法。但是,通过在现实世界中采用模拟训练的策略引入的模拟对真实性或“ SIM2REAL”分配转移通常会阻止成功的策略转移。这项研究探讨了使用视力编码器进行大规模预训练来解决SIM2REAL间隙的潜力 ...
0 0 0 2025/02/17 arXiv:2501.16389v1 yukun
几次分割(FSS)的最新进步已利用查询和支持功能之间的像素匹配,通常基于交叉注意,这些杂志可以选择性地激活与同类支持FG功能相对应的查询前景(FG)功能。但是,由于主链深层中的较大接收场,提取的查询和支持FG特征不可避免地与背景(BG)特征混合在一起,从而阻碍了FG-FG匹配的交叉注意。因此,查询FG功能与较少的支持FG功能融合在一起 ...
0 0 0 2025/02/17 arXiv:2407.09842v1 Jht
在工业异常检测中,模型效率和移动友好性成为实际应用中的主要关注点。同时,Segment Anything (SAM) 令人印象深刻的泛化能力引起了学术界的广泛关注,使其成为定位未见异常和多样化现实世界模式的理想选择。在本文中,考虑到这两个关键因素,我们提出了一种用于无监督异常检测(STLM)的 SAM 引导的双流轻量级模型,该模型不仅符合两个实际应用需求,而且还利用了 SAM 强大的泛化能力 .. ...
0 0 0 2025/02/17 arXiv:2402.19145v2 lzx
带有安装相机的无人机(UAV)具有捕获空中(鸟类视图)图像的优势。空中视觉数据的可用性以及对象检测算法的最新进展,导致计算机视觉社区专注于航空图像上的对象检测任务。因此,已经引入了几个空中数据集,包括带有对象注释的视觉数据 ...
0 0 0 2025/02/17 arXiv:2001.11737v2 19396386025
微调是针对特定任务量身定制预训练的大语言模型的主要方法。随着模型的规模和任务的多样性的扩展,参数有效的微调方法至关重要。使用最广泛的方法家族之一是低级适应(Lora)及其变体 ...
0 0 0 2025/02/17 arXiv:2401.04151v1 18636279200
大型语言模型(LLMS)在革新各种应用程序(包括内容生成,搜索和建议以及AI辅助操作)方面取得了巨大的成功。为了降低高训练成本,Experts(MOE)结构的混合体已成为现代LLM的流行骨干。然而,尽管有好处,但基于MOE的LLM的服务因稀疏激活的专家而导致严重的记忆力降低 ...
0 0 0 2025/02/17 arXiv:2502.05370v1 zhangqi

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)