一译 —— 文档和论文翻译、对照阅读、讨论和社区

Speech Command + Speech Emotion: Exploring Emotional Speech Commands as a Compound and Playful Modality

在与越来越多的代理AI系统相互作用的时代，能够与用户进行对话之间的联系，语音是指挥代理的重要方式。通过识别和使用语音情绪（即 ...

0 0 0 2025/05/07 arXiv:2504.08440v1 dqyzhwk

An Analysis of Decoding Methods for LLM-based Agents for Faithful Multi-Hop Question Answering

大型语言模型（LLMS）经常产生实际上不准确的产出 - 一种称为幻觉的现象 - 限制了其在知识密集的NLP任务中的准确性。检索授权的生成和代理框架（例如推理和代理（REACT））可以通过使模型访问外部知识来解决此问题。但是，LLM通常无法忠于检索信息 ...

0 0 0 2025/05/07 arXiv:2503.23415v1 7788

FBNetV5: Neural Architecture Search for Multiple Tasks in One Run

神经体系结构搜索（NAS）已被广泛采用，以设计准确有效的图像分类模型。但是，将NAS应用于新的计算机视觉任务仍然需要大量的努力。这是因为1）先前的NAS研究已在图像分类上过度优先，而在很大程度上忽略了其他任务； 2）许多NAS的工作重点是优化无法将其转移到其他任务的特定任务组件； 3）现有的NAS方法通常被设计为“无近距离”，需要大量努力与每个新任务的培训管道集成 ...

0 0 0 2025/05/07 arXiv:2111.10007v3 xjwit

Neural Architecture Search: Insights from 1000 Papers

在过去的十年中，深度学习的进步导致了许多领域的突破，包括计算机视觉，自然语言理解，语音识别和强化学习。专业，高性能的神经体系结构对于这些领域的深度学习成功至关重要。神经体系结构搜索（NAS）是为给定任务自动化神经体系结构设计的过程，是自动化机器学习的不可避免的下一步，并且已经超过了许多任务上最好的人为设计的体系结构 ...

0 0 0 2025/05/07 arXiv:2301.08727v2 xjwit

ProxylessNAS: Direct Neural Architecture Search on Target Task and Hardware

神经体系结构搜索（NAS）通过自动设计有效的神经网络体系结构具有很大的影响。但是，常规NAS算法的过度计算需求（例如 ...

0 0 0 2025/05/07 arXiv:1812.00332v2 xjwit

RayZer: A Self-supervised Large View Synthesis Model

我们提出了Rayzer，这是一种自我监督的多视图3D视觉模型，在没有任何3D监督的情况下训练，即相机姿势和场景几何形状，同时表现出新兴的3D意识 ...

0 0 0 2025/05/07 arXiv:2505.00702v1 小小卡拉米

EGANS: Evolutionary Generative Adversarial Network Search for Zero-Shot Learning

零击学习（ZSL）旨在识别无法为培训预测模型收集的新颖类。因此，生成模型（例如 ...

0 0 0 2025/05/07 arXiv:2308.09915v1 xjwit

Can't Slow me Down: Learning Robust and Hardware-Adaptive Object Detectors against Latency Attacks for Edge Devices

对象检测是许多实时下游应用程序（例如自动驾驶，增强现实和供应链管理）的基本推动剂。但是，神经网络的算法骨干骨干对于系统输入中不可察觉的扰动而脆弱，通常被称为错误分类攻击。通过针对实时处理能力，最近报告了一类新的延迟攻击 ...

0 0 0 2025/05/07 arXiv:2412.02171v2 WillVV

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）