多模式大语言模型(MLLM)在视觉理解任务中表现出了巨大的成功。但是,由于数据和时间复杂性的大量,挑战一直在调整这些模型以进行视频理解。使用统一框架采样的现有视频插件通常很难有效地捕获视频的关键时空线索 ...
0 0 0 2025/07/28 arXiv:2506.22139v3 Gary_huang
模糊有助于自动识别软件测试字段中的错误和漏洞。尽管它可以有效地生成崩溃的输入,但通常会手动分析这些输入。已经提出了几种根本原因分析(RCA)技术来自动分析崩溃的根本原因,以减轻这种成本 ...
0 0 0 2025/07/28 arXiv:2303.05029v2 waterfall666
有两种主要类型的不确定性可以建模。剧烈的不确定性捕获观察中固有的噪声。另一方面,认知不确定性解释了模型中的不确定性 - 不确定性可以在给定足够数据的情况下解释 ...
0 0 0 2025/07/28 arXiv:1703.04977v2 xuwenlong
AI正在经历范式转移,随着模型的兴起(例如Bert,Dall-E,GPT-3),该模型经过大规模的大规模训练,并且可以适应广泛的下游任务 ...
0 0 0 2025/07/28 arXiv:2108.07258v3 hellogdc
尽管现有的基准测试探测了各个领域的大语言模型(LLMS)的推理能力,但它们主要评估被动推理,为模型提供了达到解决方案所需的所有信息。相比之下,LLM必须与外部系统相互作用以获取缺失的证据或数据HA的积极推理很少受到系统的关注。为了解决这一短缺,我们提出了AR Bench,这是一种新颖的基准测试,旨在评估LLM的主动推理技能 ...
0 0 0 2025/07/28 arXiv:2506.08295v1 小砾往前冲
自训练,自我监督预处理和无监督的学习方面的最新进展使表演良好的语音识别系统无需任何标记的数据。但是,在许多情况下,有针对相关语言的标记数据,这些方法没有被这些方法使用。本文通过微调验证的WAV2VEC 2进行微调,扩展了对零击的跨语性转移学习的先前工作 ...
0 0 0 2025/07/28 arXiv:2109.11680v1 abala
最近,大型语言模型(LLM)引起了广泛的任务,特别是在文本分析中的出色表现引起了极大的关注。但是,由于对复杂预测任务的时间序列数据的依赖,金融部门提出了一个明显的挑战。在这项研究中,我们介绍了一个名为LLMFACTOR的新型框架,该框架采用顺序知识引导提示(SKGP)来识别使用LLMS影响库存运动的因素 ...
0 0 0 2025/07/28 arXiv:2406.10811v1 junecj
测试时间适应(TTA)旨在使用未访问源数据的未标记的测试数据来解决分配变化。在多模式数据的上下文中,比单峰数据(例如多种模式和缺失方式的同时损坏)比单峰数据更复杂的噪声模式。此外,在现实世界中,来自不同分配转移的损坏总是混合的 ...
0 0 0 2025/07/28 arXiv:2503.02616v1 xuwenlong

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)