在过去的一年中,大型语言模型(LLM)的发展迅速加速。但是,如果没有适当的转向和保障措施,LLM会很容易遵循恶意说明,提供不安全的建议并产生有毒内容。我们将SimpleSafetyTests(SST)作为新的测试套件介绍,用于快速和系统地识别此类关键的安全风险 ...
0 1 0 2025/02/20 arXiv:2311.08370v2 hzx719
大型语言模型的最新进展,尤其是在GPT-4O之后,引发了人们对开发能够理解更多模式的Omni-Modal模型的兴趣。尽管已经出现了一些开源替代方案,但性能中的专用单模式模型仍然存在着一个显着的滞后。在本文中,我们提出了Ola,这是一种Omni-Modal语言模型,与专业对应物相比,在图像,视频和音频理解中实现了竞争性能 ...
0 0 0 2025/02/20 arXiv:2502.04328v2 18242771717
在许多任务中,了解输入对输出的重要性很有用。这项工作提供了一个信息理论框架,以分析输入对文本分类任务的影响。自然语言处理(NLP)任务使用单个元素输入或多个元素输入来预测输出变量,其中元素是文本块 ...
0 0 0 2025/02/20 arXiv:2402.00978v1 皮皮家
大型语言模型在常识任务上表现出了令人印象深刻的表现。但是,这些任务通常被提出为多项选择问题,从而使模型可以利用系统的偏见。常识也是固有的概率,具有多个正确的答案。 “开水”的目的可能是茶和烹饪,但也可能杀死细菌 ...
0 0 0 2025/02/20 arXiv:2406.04145v1 皮皮家
现有的大型语言模型(LLM)基于检索的推理方法严重依赖非参数知识源的密度和质量来提供领域知识和显式推理链。然而,包容性的知识源价格昂贵,有时无法为科学或角落领域构建。为了应对这些挑战,我们引入了图启发准确性外推法(GIVE),这是一种新颖的推理框架,它集成了参数和非参数记忆,以增强非常稀疏的知识图上的知识检索和忠实推理过程 ...
0 0 0 2025/02/20 arXiv:2410.08475v2 liuyujia
由于他们提取相关时空视频嵌入的能力,视觉变形金刚(VIT)是当前在视频动作理解中表现最好的模型。但是,它们对域或数据集的概括有限。相比之下,视觉语言模型(VLM)已证明了出色的概括性能,但目前无法处理视频 ...
0 0 0 2025/02/20 arXiv:2403.16128v1 jeungga
在快速进步的视觉模型(VLM)中,人类知识的一般知识和令人印象深刻的逻辑推理能力的出现促使人们对将VLMS应用于高级自主驾驶任务(例如场景理解和决策)的兴趣日益增加。但是,一项关于知识水平,尤其是基本驾驶专业知识和闭环自动驾驶性能之间关系的深入研究需要进一步探索。在本文中,我们调查了基本驾驶知识深度和广度对闭环轨迹计划的影响,并介绍了Wisead,这是一种专门的VLM,量身定制的VLM量身定制,用 ...
0 0 0 2025/02/20 arXiv:2412.09951v2 jeungga
大型语言模型(LLM)在各种下游任务中取得了重大进展,激发了语音理解语言模型(硫)的发展,以实现基于语音的全面互动。但是,大多数先进的硫磺是由行业开发的,利用了学术界不容易获得的大规模数据集和计算资源。此外,培训细节缺乏透明度为进一步的创新带来了其他障碍 ...
0 0 0 2025/02/20 arXiv:2501.13306v2 aqzlpm11

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)