与传统的无监督聚类不同,半监督聚类允许用户为数据提供有意义的结构,这有助于聚类算法匹配用户的意图。现有的半监督聚类方法需要专家提供大量反馈来改进聚类。在本文中,我们询问大型语言模型是否可以放大专家的指导,以实现查询高效、少镜头的半监督文本聚类 ...

0 0 0 0 2024/04/25 arXiv:2307.00524v1 HoraceHQ

聚类是许多数据驱动应用领域的核心,并且在距离函数和分组算法方面已得到广泛研究。相对较少的工作集中在学习聚类表示上。在本文中,我们提出了深度嵌入式聚类(DEC),这是一种使用深度神经网络同时学习特征表示和聚类分配的方法 ...

0 0 0 0 2024/04/24 arXiv:1511.06335v2 HoraceHQ

我们引入 ClusterLLM,这是一种新颖的文本聚类框架,它利用来自指令调整的大型语言模型(例如 ChatGPT)的反馈。与基于“小型”嵌入器的传统无监督方法相比,ClusterLLM 具有两个有趣的优势:(1)即使其嵌入不可访问,它也具有 LLM 的涌现能力; (2)它通过文本指令和/或一些带注释的数据了解用户对聚类的偏好。首先,我们通过构建困难的三元组问题<A 比 C 更好地对应 B 吗>,提示 ChatGPT 对聚类角度的见解,其中 A、B 和 C 是根据小型嵌入器属于不同聚类的相似数据点 ...

0 0 0 0 2024/04/23 arXiv:2305.14871v2 HoraceHQ

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)