在这项工作中,我们通过最大化深度神经网络编码器的输入和输出之间的互信息来执行表示的无监督学习。重要的是,我们表明结构很重要:将有关输入局部性的知识纳入目标可以极大地影响表示对下游任务的适用性。我们通过对抗性地匹配先验分布来进一步控制表示的特征 ...
随着大型语言模型(LLM)在编写类似人类文本的能力方面不断进步,一个关键的挑战仍然是它们倾向于产生看似事实但毫无根据的内容。这种幻觉问题可以说是将这些强大的 LLM 安全部署到影响人们生活的现实生产系统中的最大障碍。在实际环境中广泛采用 LLM 的旅程在很大程度上依赖于解决和减轻幻觉 ...
大型语言模型(LLM)在充当代理方面取得了成功,它通过搜索引擎等工具与环境进行交互。然而,LLM 并未专门针对培训或调整期间的工具使用进行优化,这限制了它们作为代理的有效性。为了解决这个问题,之前的工作收集了 GPT-4 和环境之间的交互轨迹,并用它们对较小的模型进行了微调 ...
拥挤场景中异常行为的检测需要应对许多挑战。本文提出了一种有效的视频异常检测和定位方法。使用全卷积神经网络 (FCN) 和时态数据,将预先训练的有监督 FCN 转换为无监督 FCN,确保检测场景中的(全局)异常 ...