最近,零射击异常检测(ZSAD)已成为一个关键范式,用于识别看不见类别中的缺陷,而无需在训练阶段需要目标样本。但是,由于表示不足,现有的ZSAD方法与小小的和复杂缺陷的边界斗争。他们中的大多数人都使用手动设计的提示,无法为各种对象和异常工作 ...
大型语言模型(LLM)在语言任务中表现出了令人印象深刻的功能,但是它们需要高计算能力并依靠静态知识。为了克服这些局限性,检索功能的生成(RAG)将最新的外部信息纳入了LLM,而无需进行广泛的微调。同时,部署在边缘设备上的小语言模型(SLM)提供效率和低延迟,但通常在复杂的推理任务上挣扎 ...
小语言模型(SLM)支持在资源受限的边缘设备上有效部署,但其有限的容量损害了推理性能。检索增强的生成(RAG)是通过集成外部数据库来增强模型性能的有前途的解决方案,而无需大量的内部设备模型再培训。但是,大规模的公共数据库和特定于用户的私人上下文文档通常位于云上,并且分别位于设备上,而现有的RAG实现主要集中 ...
现有方法通常仅在汇总用户行为序列后自适应地调整表示。这种重新加权整个用户序列重新加权的粗粒方法阻碍了模型在不同情况下准确建模用户兴趣迁移的能力。为了增强模型在每种情况下从历史行为序列中捕获用户兴趣的能力,我们开发了一个名为“方案 - 适应性精细颗粒个性化网络(SFPNET)”的排名框架,该网络(SFPNET)设计了一种针对多范围的个性化个性化建议的精细粒度方法 ...
模仿学习已成为建立通用机器人的有前途的方法。但是,由于依赖高质量的专家演示,大型机器人基础模型的缩放模仿学习仍然具有挑战性。同时,大量的视频数据描绘了广泛的环境和各种行为 ...
文本到图像定制的最新进展使高保真,上下文丰富的个性化图像产生,使特定概念可以在各种情况下出现。但是,当前的方法与将多个个性化模型相结合,通常会导致属性纠缠或需要单独的培训以保持概念的独特性。我们提出了Loraclr,这是一种用于多概念图像生成的新型方法,该方法将多个Lora模型合并,每个模型都以不同的概念进行了微调,将其合并为一个单一的统一模型,而无需其他单独的微调 ...
在弱光环境中的人类行动识别对于各种现实世界应用至关重要。但是,现有方法在整个训练阶段都忽略了亮度信息的全面利用,从而导致了次优的性能。为了解决这一限制,我们提出了Owlsight,这是一个具有仿生型启发的框架,具有整个阶段照明增强,以与动作分类相互作用,以进行准确的黑暗视频人类动作识别 ...
We posit that to achieve superhuman agents, future models require superhuman feedback in order to provide an adequate training signal. Current approaches commonly train reward models from human prefer ...