无监督学习的最有前途的方法之一是将深层表示学习和深入的聚类结合在一起。最近的一些作品建议使用深层神经网络同时学习表示形式,并通过在嵌入式特征之上定义聚类损失来执行聚类。但是,这些方法对数据不平衡和分布样本敏感 ...

0 0 0 0 2025/06/29 arXiv:2109.05232v2 jecc

多标签分类是在各种现实世界应用中使用的必不可少的任务。多标签零射击学习是一种将图像分类为多个看不见的类别的方法,没有训练数据可用,而在一般零摄像的情况下,测试集可能包括观察到的类。剪辑描述器是一种基于最先进的ML Decoder注意力头的新方法 ...

0 0 0 0 2025/06/28 arXiv:2406.14830v1 jecc

大型语言模型(LLM)已有效地用于许多计算机视觉任务,包括图像分类。在本文中,我们提出了一种使用多模式LLMS的零拍图像分类的简单而有效的方法。使用多模式LLMS,我们从输入图像中生成全面的文本表示 ...

0 0 0 0 2025/06/28 arXiv:2405.15668v5 jecc

基于表格的推理在将深度模型与离散推理相结合方面取得了显着进展,这需要对自由形式自然语言(NL)问题和半结构化表格数据进行推理。然而,以前的表推理解决方案仅考虑小型表,并且在处理较大表时表现出局限性。此外,大多数现有方法都难以推理复杂的问题,因为它们缺乏必要的信息或分散在不同的地方 ...

0 0 0 0 2025/06/20 arXiv:2312.09039v3 jecc

最先进的监督NLP模型具有很高的精度,但也容易遭受低数据制度的投入的失败,例如培训数据中未表示的域。作为为特定领域收集地面真实标签的近似值,我们研究了大语模型(LLM)的使用来注释输入并改善NLP模型的概括。具体而言,鉴于LLM注释的预算,我们提出了一种算法,用于对注释和重新训练NLP模型进行最有用的输入 ...

0 0 0 0 2025/06/08 arXiv:2306.15766v1 jecc

训练大型语言模型(LLM)已在自然语言处理(NLP)的各个子学科中广泛使用。在NLP中,文本分类问题已获得了相当大的重点,但仍然面临着与昂贵的计算成本,时间消耗和不可见期的稳健性能有关的局限性。通过提示链链(COT)的提议,可以使用零射击学习(ZSL)使用逐步推理提示来实施LLM,而不是传统的问答格式 ...

0 1 0 0 2025/05/29 arXiv:2312.01044v1 jecc

Generative AI提供了一种简单的,基于及时的替代方案,用于微调较小的BERT风格的LLM,以进行文本分类任务。这有望消除对手动标记培训数据和特定于任务的模型培训的需求。但是,是否可以兑现这一承诺,仍然是一个悬而未决的问题 ...

0 0 0 0 2025/05/29 arXiv:2406.08660v2 jecc

多模式奖励模型(MRMS)在增强多模式大语模型(MLLM)的性能方面起着至关重要的作用。尽管最近的进步主要集中在改善MRMS的模型结构和培训数据上,但对长期推理能力的有效性的奖励模型以及如何激活MRM中的这些功能的探索有限。在本文中,我们探讨了如何使用加强学习(RL)来改善奖励建模 ...

0 0 0 0 2025/05/21 arXiv:2505.02835v2 jecc

在计算机视觉和图形中,头发编辑是一个有趣且具有挑战性的问题。许多现有的方法需要精心绘制的草图或口罩作为用于编辑的条件输入,但是这些相互作用既不简单又有效。为了使用户摆脱乏味的交互过程,本文提出了一种新的头发编辑交互模式,该模式可以根据用户提供的文本或参考图像单独或共同操纵头发属性 ...

0 0 0 0 2025/04/26 arXiv:2112.05142v2 jecc

在本报告中,我们介绍了第三份有关慢速思维模型的发展的技术报告,这是静止项目的一部分。随着技术途径变得更加清晰,扩展RL培训已成为实施此类推理模型的中心技术。我们系统地实验并记录了影响RL训练的各种因素的影响,对基本模型和微调模型进行实验 ...

0 0 0 0 2025/03/13 arXiv:2503.04548v1 jecc

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)