在与越来越多的代理AI系统相互作用的时代,能够与用户进行对话之间的联系,语音是指挥代理的重要方式。通过识别和使用语音情绪(即 ...
0 0 0 2025/05/07 arXiv:2504.08440v1 dqyzhwk
大型语言模型(LLMS)经常产生实际上不准确的产出 - 一种称为幻觉的现象 - 限制了其在知识密集的NLP任务中的准确性。检索授权的生成和代理框架(例如推理和代理(REACT))可以通过使模型访问外部知识来解决此问题。但是,LLM通常无法忠于检索信息 ...
0 0 0 2025/05/07 arXiv:2503.23415v1 7788
神经体系结构搜索(NAS)已被广泛采用,以设计准确有效的图像分类模型。但是,将NAS应用于新的计算机视觉任务仍然需要大量的努力。这是因为1)先前的NAS研究已在图像分类上过度优先,而在很大程度上忽略了其他任务; 2)许多NAS的工作重点是优化无法将其转移到其他任务的特定任务组件; 3)现有的NAS方法通常被设计为“无近距离”,需要大量努力与每个新任务的培训管道集成 ...
0 0 0 2025/05/07 arXiv:2111.10007v3 xjwit
在过去的十年中,深度学习的进步导致了许多领域的突破,包括计算机视觉,自然语言理解,语音识别和强化学习。专业,高性能的神经体系结构对于这些领域的深度学习成功至关重要。神经体系结构搜索(NAS)是为给定任务自动化神经体系结构设计的过程,是自动化机器学习的不可避免的下一步,并且已经超过了许多任务上最好的人为设计的体系结构 ...
0 0 0 2025/05/07 arXiv:2301.08727v2 xjwit
神经体系结构搜索(NAS)通过自动设计有效的神经网络体系结构具有很大的影响。但是,常规NAS算法的过度计算需求(例如 ...
0 0 0 2025/05/07 arXiv:1812.00332v2 xjwit
我们提出了Rayzer,这是一种自我监督的多视图3D视觉模型,在没有任何3D监督的情况下训练,即相机姿势和场景几何形状,同时表现出新兴的3D意识 ...
0 0 0 2025/05/07 arXiv:2505.00702v1 小小卡拉米
零击学习(ZSL)旨在识别无法为培训预测模型收集的新颖类。因此,生成模型(例如 ...
0 0 0 2025/05/07 arXiv:2308.09915v1 xjwit
对象检测是许多实时下游应用程序(例如自动驾驶,增强现实和供应链管理)的基本推动剂。但是,神经网络的算法骨干骨干对于系统输入中不可察觉的扰动而脆弱,通常被称为错误分类攻击。通过针对实时处理能力,最近报告了一类新的延迟攻击 ...
0 0 0 2025/05/07 arXiv:2412.02171v2 WillVV

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)