本文介绍了为基于多模式信息的语音处理(MISP)2025挑战而开发的扬声器诊断系统。首先,我们利用序列到序列神经读物(S2SND)框架来使用单渠道音频生成初始预测。然后,我们将原始的S2SN框架扩展到创建新版本,即多渠道序列到序列神经诊断(MC-S2SND),该序列使用多渠道音频来完善初始结果 ...

0 0 0 0 2025/06/30 arXiv:2505.16387v1 takkeri

在观察性研究中,记录的治疗分配并非纯粹是随机的,而是受患者特征,报销政策和现有准则等外部因素的影响。因此,只有在考虑混杂因素后才能估算治疗效果。倾向评分(PS)方法是一种广泛用于此目的的方法家族 ...

0 0 0 0 2025/06/30 arXiv:2408.17385v1 francix_xu

随机实验是用于估计因果效应的“黄金标准”,但实际上,在治疗组之间的协变量分布中存在机会失衡。如果在单位接触治疗之前就可以使用协变量数据,则可以通过在实验实验之前先检查协变量平衡来减轻这些机会的失衡。只要已提前指定了不平衡的确切定义,可以丢弃不平衡的随机化,然后进行重新授课,并且可以继续进行此过程,直到根据定义实现随机分配的平衡为止 ...

0 0 0 0 2025/06/30 arXiv:1207.5625v1 francix_xu

大型语言模型(LLMS)的快速进步加剧了由于模型参数缩放和硬件功能之间的差距的扩大而加剧了内存瓶颈。虽然训练后量化(PTQ)技术有效地减少了内存开销,但现有方法主要依赖于静态量化策略,这些策略难以适应动态工作负载。为了解决这个问题,我们提出了Flexquant,这是一个动态的精确开关框架,可优化推理速度和准确性之间的权衡 ...

0 0 0 0 2025/06/30 arXiv:2506.12024v1 xiximayou

在交互式闭环交通模拟中实现现实主义和可控性仍然是自主驾驶中的关键挑战。数据驱动的仿真方法重现了逼真的轨迹,但遭受了闭环部署的协变量转移,并通过简化的动态模型复杂化,这些模型进一步降低了可靠性。相反,基于物理的仿真方法增强了可靠且可控的闭环相互作用,但通常缺乏专家演示,损害了现实主义 ...

0 0 0 0 2025/06/30 arXiv:2505.03344v1 JiangMubai

最近,自我监督的学习吸引了极大的关注,因为它仅需要用于模型培训的未标记数据。对比学习是一种自我监督学习的一种流行方法,并实现了有希望的经验表现。但是,对其概括能力的理论理解仍然有限 ...

0 0 0 0 2025/06/30 arXiv:2111.00743v4 15966829631

实时和高性能3D对象检测在自动驾驶和机器人技术中起着至关重要的作用。最近基于支柱的3D对象探测器由于其紧凑的表示和低计算开销而引起了人们的关注,因此它们适合于车载部署和量化。但是,现有的基于支柱的检测器仍然沿高度尺寸损失信息损失,并且在支柱特征编码(PFE)期间的数值差异很大,这严重限制了其性能和量化潜力 ...

0 0 0 0 2025/06/30 arXiv:2405.18734v5 oneyhu

粗颗粒可重构阵列(CGRA)是域 - 不合稳定加速器,可提高资源约束的边缘设备的能效。 CGRA景观是多种多样的,在性能,效率和建筑专业化之间表现出权衡。但是,CGRA通常相对于其适度的计算功能过度提供通信资源 ...

0 0 0 0 2025/06/30 arXiv:2412.08137v2 hwrabbit

人工智能(AI)的最新进展已经产生了高度强大且可控制的系统。这为结构化推理以及多个AI系统和人类之间的协作创造了前所未有的机会。为了充分发挥这种潜力,必须开发一种设计和研究这种结构化相互作用的原则方法 ...

0 0 0 0 2025/06/30 arXiv:2308.01285v3 lovecoffee

大语言模型(LLM)应用的激增引起了人们对误导或捏造信息的产生(称为幻觉)的担忧。因此,检测幻觉对于维持对LLM生成的内容的信任至关重要。学习真实分类器的主要挑战是缺乏大量标记的真实和幻觉的数据 ...

0 1 0 0 2025/06/30 arXiv:2409.17504v1 mjwei

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)