对于机器人车辆在行人丰富的环境中安全有效地导航,建模微妙的人类行为和导航规则(例如,通过右侧)很重要 ...
最近,图表结构学习(GSL)最近吸引了其优化图形结构的能力以及同时学习图形神经网络(GNN)的合适参数。当前的GSL方法主要从单个或多个信息源(基本视图)学习最佳的图形结构(最终视图),但是关于最佳图形结构的理论指导仍未探索。从本质上讲,最佳的图形结构应仅包含有关任务的信息,同时尽可能地压缩冗余噪声,该噪声定义为“最小足够的结构”,以保持准确性和鲁棒性 ...
寻找可行的,无碰撞的多种系统系统可能会具有挑战性,尤其是在非交流场景中,每个代理人的意图(例如目标)对其他代理人都无法观察到 ...
视觉问题回答(VQA)是一项挑战任务,结合了自然语言处理和计算机视觉技术,并逐渐成为多模式大语模型(MLLM)中的基准测试任务。我们调查的目的是概述VQA的开发以及及时性高的最新模型的详细描述。这项调查提供了对图像和文本的自然语言理解的最新综合,以及基于核心VQA任务的图像问题信息的知识推理模块 ...
生成对抗网络(GAN)已被广泛应用于图像超分辨率(SR),以提高感知质量。但是,大多数现有的基于GAN的SR方法通常直接在图像上执行粗粒歧视,而忽略了图像的语义信息,这使得超级分辨率网络(SRN)具有挑战性,以学习与细粒度和语义相关的纹理细节。为了减轻此问题,我们提出了一种语义特征歧视方法SFD,以进行感知SR ...
风格的手写文本生成(HTG)最近从计算机视觉和文档分析社区中受到了关注,这些社区开发了几种基于gan-或扩散的解决方案,这些解决方案取得了令人鼓舞的结果。但是,这些策略未能推广到新型样式并具有技术限制,尤其是在最大产出长度和训练效率方面。为了克服这些局限性,在这项工作中,我们提出了一个新颖的文本图像生成框架,称为Emuru ...
最近的研究表明,GNN容易受到对抗攻击的影响。为了防御此类攻击,可靠的图形结构改进(GSR)方法旨在最大程度地减少基于节点特征,图形结构或外部信息的对抗边缘的影响。但是,我们发现现有的GSR方法受到狭窄量的限制,例如假设干净的节点功能,中等结构攻击以及外部清洁图的可用性,从而在现实世界中限制了适用性 ...
计算机断层扫描(CT)在医学诊断中起关键作用;但是,重建内核的变异性会阻碍数据驱动的方法,例如深度学习模型,无法实现可靠和广义的性能。为此,通过在不同来源或条件上标准化数据来最大程度地降低此类非生物方差的有希望的解决方案。在这种情况下,事实证明,生成的对抗网络(GAN)是协调的强大框架,将其作为样式转移问题 ...