Dropout旨在缓解高级视觉任务中的过拟合问题,但很少应用于低级视觉任务,例如图像超分辨率(SR)。作为一个经典的回归问题,SR 表现出与高级任务不同的行为,并且对 dropout 操作敏感。然而,在本文中,我们表明适当使用 dropout 有利于 SR 网络并提高泛化能力 ...
随着大型语言模型(LLM)执行更困难的任务,验证其行为的正确性和安全性变得更加困难。解决这个问题的一种方法是促使 LLM 将他们的推理具体化,例如: ...
多模态融合的本质在于利用不同模态固有的互补信息。然而,流行的融合方法依赖于传统的神经架构,并且不足以捕获跨模态交互的动态,特别是在存在复杂的模态内和模间相关性的情况下。状态空间模型 (SSM) 的最新进展,特别是 Mamba 模型,已成为有希望的竞争者 ...
混合专家(MOE)由于其强大的表达能力,最近成为多领域推荐(MDR)事实上的标准。然而,这种基于 MOE 的方法通常会为每个实例雇用所有专家,导致可扩展性问题以及领域和专家之间的低辨别性。此外,常用的特定领域网络的设计加剧了可扩展性问题 ...
虽然大量工作检查语言模型是否存在性别、种族、职业和宗教方面的偏见,但对地理性质的偏见的探讨相对较少。最近的一些研究对大型语言模型编码地理空间知识的程度进行了基准测试。然而,编码地理知识(或缺乏编码地理知识)对现实世界应用的影响尚未被记录 ...
使用深度学习技术的基于会话的推荐模型的最新进展已经证明了性能的显着提高。虽然它们可以增强模型的复杂性并提高建议的相关性,但它们也使实施可扩展的实时解决方案变得具有挑战性。为了应对这一挑战,我们提出了 GRAINRec——一种基于图和注意力集成的基于会话的推荐模型,可以实时生成推荐 ...
由于获取大规模显式用户反馈的困难,隐式反馈(例如点击或其他交互)被广泛用作替代数据源,其中用户-项目交互可以建模为二部图 ...
提出了跨域推荐(CDR)方法来解决点击率(CTR)估计中的稀疏问题。现有的CDR方法直接将知识从源域迁移到目标域,忽略了域之间的异质性,包括特征维度异质性和潜在空间异质性,这可能导致负迁移。此外,现有方法大多基于单源迁移,无法同时利用多个源领域的知识来进一步提高目标领域的模型性能 ...