稳定扩散和Dalle-3等文本对图像模型仍在多转图像编辑方面难度。我们将这些任务分解为工具使用的代理工作流(路径),该任务通过AI的成本工具来解决一系列子任务。常规的搜索算法需要昂贵的探索才能找到工具路径 ...
可逆的重新恢复网络(IRNS)及其变体在各种图像处理任务中都取得了显着的成就,例如图像缩放。但是,我们观察到,具有更深层网络的IRN难以训练,从而阻碍了IRN的代表性。为了解决这个问题,我们建议通过学习高分辨率图像与其低分辨率对应物之间具有特定分布的高分辨率图像之间的两次试验,以进行图像重新缩放 ...
我们研究单位图3D对象重建的问题。最近的工作已经分散到两个方向:基于回归的建模和生成建模。回归方法有效地推断出可见的表面,但在遮挡区域中挣扎 ...
Shapley值(SV)已成为一种有前途的数据评估方法。但是,计算或估计SV通常在计算上很昂贵。为了克服这一挑战,贾等人 ...
云系统是当今计算行业的骨干。然而,这些系统在设计,构建,操作和改进方面仍然很复杂。所有这些任务都需要这些系统的开发人员和运营商的大量手动努力 ...
最近,神经辐射场(NERF)在新型视图合成,表面重建等方面取得了重大成功。但是,由于在其渲染管道中没有考虑物理反射,因此NERF将镜像中的反射视为单独的虚拟场景,导致镜像不准确的镜像和多景观镜面反射的反射。在本文中,我们提出了一个新型的神经渲染框架,称为Mirror-nerf,该框架能够学习准确的几何形状和镜子的反射,并支持带有镜子的各种场景操纵应用,例如将新物体或镜像添加到场景中并合成镜子中这些 ...
TTPLA: An Aerial-Image Dataset for Detection and Segmentation of Transmission Towers and Power Lines
从空中图像中准确检测和分割传输塔〜(TTS)和电源线〜(PLS)〜(PLS)在保护电网安全性和低空无人机安全性方面起着关键作用。同时,TTS和PLS的空中图像对从事对象检测和分割的计算机视觉研究人员构成了许多新挑战 - PLS长而薄,并且可能显示出与背景相似的颜色; TT可以具有各种形状,很可能由各种稀疏性的线结构组成;背景场景,照明和物体大小可能因一个图像而异。在本文中,我们收集并发布了新的T ...
大型语言模型(LLM)在理解和发电方面表现出了出色的功能。但是,在与现实世界中的人类指示互动时,LLMS仍然面临重大挑战,尤其是在准确捕获和理解人类的指示和意图方面。本文重点介绍了基于LLM的文本生成任务中的三个挑战:指导理解,意图推理和可靠的生成 ...