几乎没有开放的开放式识别(FSOR)是一项艰巨的实践价值的挑战。它的目的是将样本分类为预定义的封闭式类别之一,该类别以几个示例说明,同时能够拒绝未知类别的样本。在这项工作中,我们通过提出一种新型的基于能量的混合模型来处理FSOR任务 ...
0 0 0 2025/03/26 arXiv:2304.11855v1 crx
我们介绍momask,这是一种新颖的蒙版建模框架,用于文本驱动的,3d人体运动生成。在momask,采用分层量化方案将人体运动表示为具有高保真细节的多层离散运动标记。从基础层开始,采用分层量化方案将人体运动表示为具有高保真细节的多层离散运动标记。从基础层开始,利用通过矢量量化获得的运动 Token ,导出递增阶的剩余 ...
0 0 0 2025/03/26 arXiv:2312.00063v1 parsifalster
开放式分类(OSC)打算将封闭式分类模型调整到现实世界中的情况下,其中分类器必须正确标记已知类别的样本,同时拒绝以前未见的未知样本。直到最近,研究才开始研究能够正确处理这些未知样本的算法。其中一些方法通过将分类器学会拒绝的训练集负面样本包括在训练集中,以期待这些数据会增加分类器在未知类别上的鲁棒性 ...
0 0 0 2025/03/26 arXiv:2210.06789v2 crx
当前的基于知识的问题答案的方法(KBQA)通常依赖于复杂的培训技术和模型框架,从而导致实际应用的许多局限性。最近,大语言模型(LLMS)中的文本学习(ICL)功能的出现提供了一个简单且无训练的语义解析范式的KBQA:给定少数问题及其标记的逻辑形式,例如演示示例,LLM可以理解一个新问题的逻辑形式,并为新问题生成逻辑形式。但是,当前强大的LLM在预训练期间几乎没有接触逻辑形式,从而导致高格式错误率  ...
0 0 0 2025/03/26 arXiv:2309.04695v2 15966829631
分类的目标是正确分配标签以看不见的样本。但是,大多数方法都用看不见的标签错误分类样本,并将其分配给已知类别之一。开放式分类(OSC)算法旨在最大化封闭式和开放式识别功能 ...
0 0 0 2025/03/26 arXiv:2406.09112v1 crx
大型语言模型(LLM)在处理长序列方面表现出了巨大的潜力,但由于预填充阶段的二次计算复杂性以及在解码阶段的KV缓存的较大记忆足迹,因此有效地服务于这些长篇小说模型仍然具有挑战性。为了解决这些问题,我们引入了Lserve,这是一个有效的系统,可通过混合稀疏的注意力加速长期效果LLM。该方法将预填充和解码的注意力统一的不同硬件,结构化的稀疏模式统一到单个框架中,在此框架中,对较小重要的 Token 进 ...
0 0 0 2025/03/26 arXiv:2502.14866v1 magicp
人工设计的视觉手册是形状组装活动中的关键组成部分。他们为我们如何以方便且可实现的方式移动和连接不同零件的分步指导。尽管在执行集会任务的建筑代理方面一直在进行努力,但人类设计手册中的信息在很大程度上被忽略了 ...
0 0 0 2025/03/26 arXiv:2302.01881v1 Curry123
为了实现准确和低成本的3D对象检测,现有方法提出,通过带有激光雷达模态提供的空间提示,使基于相机的多视图检测器受益,例如,密集的深度监督和鸟眼视图(BEV)特征蒸馏 ...
0 0 0 2025/03/26 arXiv:2212.13979v1 lcaiwen

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)