人类可以从顺序视觉观察(例如以自我为中心的视频流)来感知和理由。但是,预估计的模型如何获得此类能力,尤其是高级推理,尚不清楚。本文介绍了Bobsodied-R,这是一个合作的框架,结合了大规模视觉语言模型(VLMS),用于感知和小规模语言模型(LMS)进行推理 ...
物理知识的神经网络(PINN)方法是一种使用深度学习来求解部分微分方程的新方法。 $ l^2 $物理信息损失是培训物理信息神经网络的事实上的标准。在本文中,我们通过研究损失函数与学习解决方案的近似质量之间的关系来挑战这种常见实践 ...
通过进化算法解决受限的多目标优化问题已引起了相当大的关注。通过使用不同的算法策略,进化运算符和约束处理技术,已经开发了各种受约束的多目标优化进化算法(CMOEAS)。 CMOEA的性能可能很大程度上取决于所使用的操作员,但是,通常很难为当前的问题选择合适的操作员 ...
我们考虑了一个很大的实际兴趣问题:从其条目的采样中恢复数据矩阵。假设我们观察到从矩阵M随机选择的M条目。我们可以完成矩阵并恢复我们尚未看到的条目吗?我们表明,一个人可以从看起来不完整的条目中完美地恢复大多数低级矩阵 ...
人们越来越多地转向大型语言模型(LLMS),以进行复杂的信息任务,例如学术研究或计划搬到另一个城市。但是,尽管他们通常需要以非线性方式工作,例如 ...
组成零射击学习(CZSL)旨在识别所见状态和对象的看不见的构图。手动标记的语义信息及其实际的视觉特征之间的差异导致各种对象类和状态类的分布的视觉偏差显着失衡,这被现有方法忽略了。为了改善这些问题,我们将CZSL任务视为一项不平衡的多标签分类任务,并提出了一种新的方法,称为CZSL的状态对象组件(必须),该方法为模型提供了平衡的电感偏见 ...
属性和对象(A-O)分解是组成零摄入学习(CZSL)的基本和关键问题,其目的是识别基于已久的知识的新型A-O组成。基于分离表示学习的现有方法忽略了A-O原始对之间的上下文依赖性。受此启发,我们为CZSL提出了一个新颖的A-O脱节框架,即类别规定的级联网络(CSCNET) ...
近年来,大型模型在各个领域(例如自然语言处理和计算机视觉)中取得了重大进展,从而促进了具体概念的表达。与通常与物理对象直接相关的具体概念不同,通过自然语言表达抽象概念需要相当大的努力,这是由其复杂的语义和内涵造成的。另一种方法是利用图像传达丰富的视觉信息作为补充 ...