大型语言模型(LLM)被广泛采用,以生成用于各种自然语言处理(NLP)任务的合成数据集,例如文本分类和摘要。但是,准确地衡量这些合成数据集的多样性 - 对于健壮的模型性能 - 捕获至关重要的方面是一个重大挑战。在本文中,我们介绍了DCScore,这是一种从分类的角度测量合成数据集多样性的新方法 ...
0 0 0 2025/06/05 arXiv:2502.08512v1 zhtzhtzht
被阻塞的人重新识别(REID)是一项公制的学习任务,涉及根据其外观匹配被遮挡的人。尽管许多研究已经解决了由物体引起的遮挡,但多人闭塞的探索仍然较少。在这项工作中,我们确定并解决了先前遮挡的REID方法所忽略的关键挑战:当在同一边界框中可见多个个体时,出现的多人模棱两可(MPA),使得无法确定候选人中预期的REID目标 ...
0 0 0 2025/06/05 arXiv:2407.18112v1 gonghaibin
目的:在癌症手术期间准确对组织边缘进行分类,对于确保完全去除肿瘤至关重要。快速蒸发电离质谱法(REIMS)是一种实时术中边缘评估的工具,生成了需要机器学习模型来支持临床决策的光谱。但是,在手术环境下标记的数据的稀缺提出了重大挑战 ...
0 0 0 2025/06/05 arXiv:2504.11519v1 jeremychou
具有数十亿个参数的大型语言模型(LLMS)由于许多现实世界应用的高度计算需求,内存需求和不切实际性,面临着全面填充的重大挑战。当面对有限的计算资源或小数据集时,更新所有模型参数通常会导致过度拟合。为了解决这个问题,已经提出了轻巧的固定技术,例如学习低级适配器层 ...
0 0 0 2025/06/05 arXiv:2412.12951v1 youkbok
Panoptic分割将语义和实例ID标签分配给图像的每个像素。由于实例ID的排列也是有效的解决方案,因此该任务需要学习高维一对多映射。结果,最先进的方法使用定制的体系结构和特定于任务的损失功能 ...
0 0 0 2025/06/05 arXiv:2210.06366v4 海海海氵每
天体物理学中的机器学习模型通常受到范围的限制,无法适应新工具或任务的数据。我们介绍了SpectraFM,这是一种基于 Transformer 的基础模型架构,可以在任何波长范围和仪器的恒星光谱上进行预训练。 SpectraFM通过将灵活性与从预训练中的知识转移相结合,从而超过传统的机器学习方法,尤其是在培训数据有限的情况下,它可以超越概括 ...
0 0 0 2025/06/05 arXiv:2411.04750v1 jeremychou
形状是具有时间序列分类的高解释性的判别子序列(或形状)。由于碎屑发现的时间密集型性质,现有的基于碎屑的方法主要集中于选择歧视形状,同时丢弃其他人以实现候选子序列的稀疏。但是,这种方法可能排除有益的形状,并忽略形状对分类性能的不同贡献 ...
0 0 0 2025/06/05 arXiv:2505.06892v2 betask
本文介绍了Alphaone($ \ alpha $ 1),这是一个通用框架,用于在测试时调节大型推理模型(LRMS)的推理进度。 $ \ alpha $ 1首先引入$ \ alpha $时刻,它代表带有通用参数$ \ alpha $的规模思维阶段。在此缩放的PRE-$ \ alpha $时刻阶段中,它通过建模推理过渡 Token 作为Bernoulli随机过程的插入来动态安排缓慢的思维过渡 ...
0 0 0 2025/06/05 arXiv:2505.24863v1 dusk

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)