图像恢复是旨在从损坏的输入图像(例如Deblurring和deraining)中获得高质量图像的任务。在图像恢复中,通常有必要在空间细节和上下文信息之间保持复杂的平衡。尽管多阶段网络可以最佳地平衡这些竞争目标并实现出色的性能,但这也提高了系统的复杂性 ...
我们介绍了Phi-4-Mini和Phi-4-Multimodal,紧凑但功能高度的语言和多模型模型。 PHI-4-MINI是一种3.8亿参数语言模型,该模型在高质量的Web和合成数据上训练,大大优于最近大小相似的开源模型,并匹配其在数学和编码任务上的大小和需要复杂推理的模型的性能 ...
这项工作使用最先进的语言模型GPT-3为知识库发展提供了一种新颖的信息提取方法。建议的方法试图解决与从非结构化文本获得相关实体和关系相关的困难,以提取结构化信息。我们对来自不同领域的大量文本语料库进行实验,以评估我们建议的技术的性能 ...
知识蒸馏(KD)是将大规模模型压缩为较小模型的事实上的标准。先前的工作已经探索了涉及不同目标功能,教师尊重和体重继承的越来越复杂的KD策略。在这项工作中,我们探讨了一种替代但简单的方法 - 主动数据策展作为对比度多模式预处理的有效蒸馏 ...
香草图像完成方法对大型缺失区域表现出敏感性,这归因于有限的参考信息的合理生成。为了减轻这种情况,现有方法将额外的提示作为图像完成指导。尽管有所改进,但这些方法通常仅限于采用单一模态(e ...
在自动化的论文评分(AES)中,最近的努力已转向交叉宣传的设置,这些设置在看不见的提示中得分为实际适用性。但是,在获得及时的临时论文代表方面,经过论文评分对培训的先前方法构成了挑战。在这项工作中,我们提出了一个语法意识的交叉推测特质评分(GAPS),该评分内部捕获了迅速独立的句法方面,以学习通用论文表示 ...
现有的点云完成方法通常取决于预定义的合成训练数据集,当应用于分布外的现实世界扫描时会遇到重大挑战。为了克服这一限制,我们引入了一个零拍的完成框架,称为GENPC,旨在通过利用显式3D生成先验来重建高质量的现实世界扫描。我们的关键见解是,最近在互联网规模的数据中训练的近期馈电3D生成模型已经证明了在零摄影设置中从单视图中执行3D代的能力 ...
标记数据的有限可用性导致了半监督学习的进步,以进行医学图像分割。为一般分割而定制的现代大型模型,例如任何模型(SAM),已经揭示了强大的概括能力。但是,将这些模型直接应用于医学图像分割仍然会暴露出绩效降解 ...