随着深度神经网络的最新成功,面部识别取得了显着的进步。但是,收集大规模的现实世界训练数据以进行面部识别是充满挑战的,尤其是由于标签噪声和隐私问题。同时,现有的面部识别数据集通常是从Web图像中收集的,缺少属性的详细注释(e ...
0 0 0 2025/07/24 arXiv:2108.07960v2 高一辰
扩散模型以其生成能力通过噪声和降解过程模拟数据创建的能力而闻名,已成为一种有前途的构建生成推荐人的方法。为了纳入个性化用户历史记录,现有方法通常采用有条件的扩散框架,其中对噪声重建项目重建项目的反向剥夺过程进行了修改以根据用户历史记录进行调节。但是,这种设计可能无法完全利用历史信息,因为它因建模“项目$ \ leftrightarrow $噪声”的需要而分心 ...
0 0 0 2025/07/24 arXiv:2507.06121v1 junecj
最近努力直接使用大型语言模型(LLMS)作为执行交互式计划任务的代理模型显示出值得称赞的结果。但是,尽管取得了成就,但由于他们对``真实的''物理世界的不良理解,他们仍然在全球计划中无脑反复试验并在当地计划中产生幻觉行动。模仿人类的心理世界知识模型,该模型在任务之前提供全球先验知识,并在任务期间保持本地动态知识,在本文中,我们引入了参数世界知识模型(WKM),以促进代理计划 ...
0 0 0 2025/07/23 arXiv:2405.14205v4 orion.zou
多模式的大语言模型(MLLM)在推理任务中表现出了有希望的能力,但仍在与需要明确自我反思和自我纠正的复杂问题上挣扎,尤其是与他们的单峰基于文本的同行相比。现有的反思方法是简单的,并且难以产生有意义的和启发性的反馈,因为预训练模型的推理能力和知识限制在初始培训期间很大程度上是固定的。为了克服这些挑战,我们提出了多模式的自我反思增强推理的推理(SRPO),这是一个两阶段反思 - 意识到的强化学习(RL ...
0 0 0 2025/07/23 arXiv:2506.01713v2 smpublic
我们为著名的主链指数提供了一个精确的表达,以在临界时二维二维中的伯努利渗透。事实证明它是基本函数的根。与该模型的先前已知的ARM指数相反,这些模型都是理性的,它具有先验价值 ...
0 0 0 2025/07/23 arXiv:2309.05050v2 fazai001
随着在线教育的快速发展,知识追踪(KT)已成为一个基本问题,它可以追溯到学生的知识状况并预测他们在新问题上的表现。在线教育系统中,问题通常很多,并且与技能的相关性总是很少。但是,以前的文献没有涉及问题信息以及高阶问题技能相关性,这主要受数据稀疏性和多技能问题的限制 ...
0 0 0 2025/07/23 arXiv:2009.05991v1 vivi
训练后量化(PTQ)通过将完整的精度重量映射到低位重量而无需昂贵的重新训练的情况下,可以减少模型的内存足迹,但可以降低其下游性能,尤其是在低2到3位设置中。我们开发了一种新的混合精液PTQ方法,即任务电路量化(TACQ),该方法与自动化电路发现相似,将量化过程直接调节到特定的重量电路上 - 我们将其定义为与下游任务性能相关的一组权重。这些权重保持为16位的权重,而其他权重进行量化,保持性能,同时仅 ...
0 0 0 2025/07/23 arXiv:2504.07389v2 felixslu
遥感的视觉语言模型得益于其广泛的预处理显示出了有希望的用途。但是,它们在零摄像场景分类方法中的常规用法仍然涉及将大图像分为补丁并做出独立的预测,即 ...
0 0 0 2025/07/23 arXiv:2409.00698v2 Jht

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)