现有的视觉计数工作主要一次集中于一个特定类别,例如人、动物和细胞。在本文中,我们感兴趣的是对所有内容进行计数,即仅在给定该类别中的几个带注释的实例的情况下对任何类别中的对象进行计数。为此,我们将计数作为几次回归任务... ...
大型语言模型(LLMS)需要适应数据,任务和用户偏好的持续更改。由于其大小和与培训相关的高成本,LLM不适合频繁进行再培训。但是,必须进行更新,以使其与人类知识迅速发展 ...
基于神经辐射场(NERF)3D重建对于沉浸式增强和虚拟现实(AR/VR)应用非常需要,但是实现了即时(即<5秒)的启动NERF NERF培训仍然是一个挑战 ...
视频生成的最新进展导致视觉质量和时间连贯性的显着改善。为此,已经出现了可控制的视频,可以通过明确定义的空间路径来启用精确的对象运动控制。但是,现有的方法与复杂的对象运动和多对象运动控制障碍,从而导致轨迹依从性不精确,对象一致性差和视觉质量受损 ...
最近,神经表示(NR)取代了驱动常规计算机图形的渲染和反向渲染算法。 NR最近被用来学习场景的几何和材料特性,并使用信息来综合逼真的图像,从而有望替换具有可扩展质量和可预测性能的传统渲染算法。在这项工作中,我们提出一个问题:神经图形(NG)是否需要硬件支持?我们研究了代表性的NG应用程序,表明,如果我们想渲染4K res ...
多项选择题(mcq)是大型语言模型(llm)评估中常见但重要的任务格式。这项工作表明,llm由于其固有的“选择偏见”,很容易受到mcq中选项位置变化的影响 ...
有效的指令调整是优化代码LLM,将模型行为与用户期望保持一致的必不可少的,并在现实世界应用程序中提高模型性能。但是,大多数现有的方法都集中在代码片段上,这些代码段仅限于特定功能和刚性结构,从而限制了合成数据的复杂性和多样性。为了解决这些局限性,我们介绍了一个受抽象语法树(AST)启发的基于特征树的合成框架 ...
医疗图像分割 - 众多临床需求的先决条件 - 最近的卷积神经网络(CNN)的进展显着繁荣。但是,它对显式远程关系建模和现有治疗方法表现出一般局限性,诉诸于建造深层编码器以及积极的下采样操作,从而导致冗余的深层网络和本地化细节的丢失。因此,细分任务等待着一个更好的解决方案,以提高建模全球环境的效率,同时保持对低级细节的强烈掌握 ...