最近的进步表明,通过基于规则的强化学习(RL)和结果奖励,通过基于规则的强化学习(RL)在多模式大语言模型(MLLM)中取得了成功。但是,这种范式通常缺乏对导致最终HTTP URL结果的思维过程的监督,该模型可能会学习亚最佳推理策略,这可能会阻碍其泛化能力。鉴于此,我们提出了Sophiavl-R1,以尝试在此范式中为思考过程添加奖励信号 ...
大型推理模型(LRMS)最近将其强大的推理功能扩展到了使用经过思考的推理,以决定是否应回答请求。尽管这种新方法为平衡模型实用程序和安全性提供了有希望的途径,但其稳健性仍然没有得到充实。为了解决这一差距,我们介绍了恶意教育者,这是一个基准,该基准掩盖了看似合理的教育提示下的极其危险或恶意的要求 ...
多模式模型(MLLM)的最新进步证明了在理解和生成文本图像内容方面的显着功能。但是,它们在专业领域的有效性尤其是那些需要资源有效和特定域的适应性的效果仍然有限。在这项工作中,引入了一种轻巧的多模式模型,该模型被引入了,专门适用于分析僻静地区的遥感图像,包括具有挑战性的导弹发射场 ...
遥感应用程序通常在Edge硬件上运行,该应用程序无法托管当今的7B参数多模式模型。本文介绍了Tinyrs,这是针对遥感任务优化的第一个2B参数多模式的小型语言模型(MSLM),以及其推理增强的变体Tinyrs-R1。基于QWEN2-VL-2B,TINYRS通过四阶段管道进行了培训:对百万卫星图像进行预训练,在视觉指导示例上调整教学示例,对拟议的推理数据集的经过思考(COT)注释进行微调,并通过小组相对策略优化(GRPO)对齐 ...
我们提出了MM-Eureka,这是一种多模式推理模型,成功地将基于规则的大规模强化学习(RL)扩展到了多模式推理。尽管基于规则的RL在提高LLMS在文本域中的推理能力方面取得了巨大的成功,但其在多模式设置中的应用仍然具有挑战性。我们的工作重现了多模式空间中基于文本的RL系统(例如DeepSeek-R1)的关键特征,包括准确奖励和响应长度的稳定增加以及反射行为的出现 ...
视觉语言模型(VLM)在许多直接的多模式任务中都表现出色,但努力将这种能力转化为诸如游戏之类的互动式,视觉丰富的环境中的有效决策。这个``知道的''差距显着限制了它们作为自主代理的潜力,因为领先的VLM经常在简单的游戏中表现出色。为了解决这个问题,我们介绍了VLM-GYM,这是一个精心策划的增强学习(RL)环境,具有带有统一接口和可调节的构图难度的各种视觉游戏,专门设计用于可扩展的多游戏并行训练 ...
多模式大语言模型(MLLM)的最新进展已在各种视觉任务中表现出令人印象深刻的结果。但是,在遥感(RS)中,高分辨率和一小部分对象对现有的MLLM构成了挑战,这些挑战与以对象为中心的任务困难,尤其是在精确的本地化和每个对象的精确粒度属性描述中。这些RS MLLM尚未超过经典的视觉感知模型,因为它们仅提供粗略的图像理解,从而在现实世界中导致有限的增长 ...
随着LLM最近流行的趋势,对LLM安全培训的需求不断增加。在本文中,我们在简单的,无优化的攻击下研究了SOTA开源LLMS的脆弱性,我们称为$ \ textit {priming Attacks} $,易于执行并有效地绕过安全培训中的对齐。我们提出的攻击提高了Llama Guard衡量的有害行为的攻击成功率最高3美元 ...
许多越狱(MSJ)是一种对抗技术,它利用现代LLM的长上下文窗口来规避模型安全培训,包括在许多````假''''助手助手助手助手不适当地做出反应之前的示例。有了足够的例子,该模型的内在学习能力超越了其安全培训,它的反应好像是``伪造''助手。在这项工作中,我们探讨了单独和组合减轻MSJ攻击的不同微调和输入消毒方法的有效性 ...
大型语言模型(LLMS)旨在生成有益且安全的内容。但是,对抗性攻击通常称为越狱,可以绕开其安全协议,促使LLMS产生有害内容或揭示敏感数据。因此,调查越狱方法对于暴露于LLM中的系统性脆弱性至关重要,最终指导开发人员不断实施安全性增强 ...