随着物联网生态系统的快速增长,自动调制分类(AMC)变得越来越重要。但是,扩展的信号长度提供了大量的信息,但会阻碍模型的适应性,引入更多的噪声干扰,延长训练和推理时间,并增加开销的存储空间。为了弥合这些必需品之间的差距,我们提出了一个新颖的AMC框架,该框架被指定为基于Mamba的自动调制分类(MAMCA) ...
0 0 0 2025/06/12 arXiv:2405.11263v1 zjn_a
了解大型音频模型(LALM)的内部机制对于解释其行为和提高性能至关重要。这项工作对LALMS内部感知和识别听觉属性进行了深入分析。通过在三个最先进的LALMS上应用词汇投影,我们会跟踪属性信息如何跨层和 Token 位置演变 ...
0 0 0 2025/06/12 arXiv:2506.05140v1 ka
现代大型语言模型(LLMS)具有出色的角色扮演能力,使他们不仅体现了人类角色,还体现了非人类实体。这种多功能性使他们能够在各种情况下模拟复杂的类似人类的相互作用和行为,并模拟特定的对象或系统。尽管这些功能增强了用户的参与度并引入了新型的交互模式,但角色扮演对LLMS推理能力的影响仍然没有得到充实 ...
0 0 0 2025/06/12 arXiv:2308.07702v2 Jooooe
随着深度学习的快速发展,许多基于深度学习的方法在对象检测任务中取得了重大成就。人们普遍知道,深度学习是一种数据驱动的方法。数据在某种程度上直接影响对象探测器的性能 ...
0 0 0 2025/06/12 arXiv:2103.05569v2 dm616703
语音大语言模型(SpeechLlms)的最新进展引起了很大的关注。尽管如此,当前方法在遵守语音说明方面表现出次优性能。值得注意的是,与直接文本形式输入相比,在处理语音形式输入时,模型的智能会大大减少 ...
0 0 0 2025/06/12 arXiv:2503.02769v2 ka
支持语音的语言模型的最新进展显示了建立智能语音助手的有希望的结果。但是,大多数现有的方法都依赖于大规模的配对语音文本数据和广泛的计算资源,这在可伸缩性和可访问性方面构成了挑战。在本文中,我们提出了\ textbf {tesu-llm},这是一个新颖的框架,可仅使用文本数据培训培训语言能力的语言模型 ...
0 0 0 2025/06/12 arXiv:2506.06343v1 ka
手术室(OR)是复杂的高风险环境,需要对医务人员,工具和设备之间的相互作用进行精确了解,以增强手术援助,情境意识和患者安全。当前的数据集的规模不足,现实主义,并且不会捕获场景的多模式性质,从而限制了或建模的进度。为此,我们介绍了MM-OR,这是一种现实且大规模的多模式时空或数据集,也是第一个启用多模式场景图生成的数据集 ...
0 0 0 2025/06/11 arXiv:2503.02579v1 Curry123
当获得的面部变异性增加时,面部识别系统的性能会降低。先前的工作可以通过监视预处理的面部质量或预测数据不确定性以及面部功能的情况来减轻此问题。本文提出了岩石面,这是一种学习通用特征嵌入的损失类别,其大小可以测量给定面部的质量 ...
0 0 0 2025/06/11 arXiv:2103.06627v4 qiuyan

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)