结构化纵向电子健康记录(EHR)数据的固有复杂性在与大型语言模型(LLMS)集成时,构成了重大挑战,这些模型传统上是针对自然语言处理量身定制的。由于缺乏历史数据而导致的传统预测模型在新疾病爆发期间迫切需要迅速决策,这项研究调查了LLM(例如GPT-4)对EHR数据的适应性。我们特别关注他们的零拍功能,这使他们能够在未经明确培训的情况下做出预测 ...
生成检索(GR)通过大型语言模型(LLM)的出现进行了彻底改变文档的检索,而基于LLM的GR逐渐被该行业采用。尽管具有显着的优势和潜力,但基于LLM的GR仍遭受了幻觉的影响,并生成了与查询无关的文档,在某些情况下与查询无关,严重挑战了其在实际应用中的信誉。因此,我们提出了一个旨在减轻检索幻觉的优化GR框架,该框架将知识蒸馏推理整合在模型培训中,并结合决策代理,以进一步提高检索精度 ...
线段检测是计算机视觉中的一项基本低级任务,此任务的改进可能会影响取决于它的更高级方法。为线段检测开发的大多数新方法都是基于卷积神经网络(CNN)。我们的论文旨在应对阻止更广泛采用基于 Transformer 的线段检测方法的挑战 ...
表面缺陷检查对于工业制造和生产至关重要。尽管基于深度学习的缺陷检查方法取得了重大进展,但这些方法仍然存在一些挑战,例如背景中无法区分的弱缺陷和类似缺陷的干扰。为了解决这些问题,我们提出了一个具有多个阶段CNN(卷积神经网络)特征注入的 Transformer 网络,用于表面缺陷分割,这是一个名为Cinformer的Unet样结构 ...
长尾部不平衡分布是实用计算机视觉应用中的一个常见问题。以前的工作提出了解决此问题的方法,可以将其分为几个类:重新采样,重新加权,转移学习和功能增强。近年来,扩散模型在许多深度计算机视觉的子问题中表现出令人印象深刻的产生能力 ...
数据集蒸馏(DD)在创建小型数据集方面取得了重大进展,这些数据集封装了来自大型原始信息的丰富信息。特别是,基于生成先验的方法表现出令人鼓舞的性能,同时保持计算效率和跨体积概括。但是,生成过程缺乏每个样本的明确可控性 ...
无监督的大规模视力语言预训练已显示出各种下游任务的有希望的进步。现有的方法通常通过每种模态的全局特征的相似性对跨模式相互作用进行建模,该功能错过了足够的信息,或者在视觉和文本 Token 时使用交叉/自我注意力进行较细粒度的相互作用。但是,跨/自我发作在训练和推理中均具有较低的效率 ...
建模标签相关性始终在多标签图像分类(MLC)中起着关键作用,引起了研究人员的极大关注。但是,最近的研究过分强调了标签之间的共发生关系,这可能导致过度强调的风险过高,从而导致次优模型。为了解决这个问题,我们主张平衡标签之间的相关性和歧视性关系,以减轻过度拟合和增强模型性能的风险 ...