建筑物变革检测对于城市发展,灾难评估和军事侦察仍然具有挑战性。尽管类似模型(SAM)之类的基础模型显示出强大的细分功能,但由于域间隙问题,SAM在构建变更检测的任务中受到限制。现有的基于适配器的微调方法因建筑物分布不平衡而面临挑战,导致对微妙变化的发现和不准确的边缘提取 ...
关于大语言模型(LLM)的研究经常忽略了微妙的偏见,尽管明显地看不见,但可以显着影响模型对特定社会叙事的产出。这项研究解决了LLMS中的两个这样的偏见:代表性偏见,它表示LLM产生的输出的趋势,反映了某些身份群体的经验和亲和力偏见,反映了模型对特定叙述或观点的评估偏好。我们介绍了两个新颖的指标来衡量这些偏见:代表性偏差评分(RB)和亲和力偏差分数(ABS),并介绍以创造力为导向的生成套件(COGS ...
通常使用两步管道对车道检测进行处理,其中首先预测了车道标记的分割面膜,然后将车道线模型(例如抛物线或样条)安装在后期处理的面罩上。这种两步方法的问题是,网络的参数不是针对感兴趣的真实任务(估计车道曲率参数)而不是优化的,而是针对代理任务(分段泳道标记),从而导致了次优的性能。在这项工作中,我们提出了一种以端到端方式训练车道检测器的方法,直接回归车道参数 ...
车道检测是自动驾驶中最重要的任务之一。由于各种复杂的情况(例如 ...
最近,知识图(KG)的引入通过促进发现项目之间的潜在关联显着改进了推荐系统。然而,现有方法仍然面临一些局限性。首先,大多数 KG 都存在事实缺失或范围有限的问题 ...
Molar: Multimodal LLMs with Collaborative Filtering Alignment for Enhanced Sequential Recommendation
顺序推荐 (SR) 系统在过去十年中取得了显着发展,从传统的协作过滤方法过渡到深度学习方法,最近又过渡到大型语言模型 (LLM)。虽然 LLM 的采用推动了实质性进步,但这些模型本质上缺乏协同过滤信息,主要依赖于文本内容数据而忽略了其他模式,因此无法实现最佳推荐性能。为了解决这个限制,我们提出了 Molar,一种多模态大语言顺序推荐框架,它将多种内容模态与 ID 信息集成在一起,以有效捕获协作信号 ...
大型语言模型(LLMS)在利用全面的世界知识和复杂的推理机制来实现推荐任务方面表现出了显着的能力。但是,一个显着的限制在于它们无法有效地对稀疏标识符进行建模(例如 ...
大型语言模型(LLMS)在Winograd Schema Challenge(WSC)等任务中表现出了很大的成功,展示了先进的文本常识性推理。但是,将这种推理应用于多模式域,在这种多模式领域中,理解文本和图像是必不可少的,这仍然是一个重大挑战。为了解决这个问题,我们介绍了Winovis,这是一个新颖的数据集,专为在多模式上下文中的代词歧义上探测文本对图像模型 ...