推荐系统(RECSYS)在现代社会中已经至关重要,推动了不同在线平台的用户参与度和满意度。大多数Recsys都致力于设计一个强大的编码器,以将用户和项目嵌入高维矢量表示空间中,并具有损失功能来优化其表示形式。最近的研究表明,直接优化表示分布的关键特性,例如对齐和均匀性,可以超越复杂的编码器设计 ...
通常,自我监督学习到3D医学数据的应用选择使用成功的2D网络体系结构的3D变体。尽管有希望的方法,但它们在计算上要求训练的要求更大,从而将这些方法的广泛适用性从具有适度的计算资源的方法中脱颖而出。因此,在本文中,我们旨在通过隐式建模这些数据集的固有3D性质来改善标准2D SSL算法 ...
文本对图像扩散模型具有前所未有的能力,可以产生多样化和高质量的图像。但是,他们经常努力忠实地捕获包括多个主题在内的复杂输入提示的预期语义。最近,已经引入了许多布局到图像扩展,以改善用户控制,旨在本地化特定 Token 代表的主题 ...
虽然 Transformer 以浮点(FP)矩阵 - 刺激为主导,但它们通过专用硬件或多核可编程系统的积极加速已将性能瓶颈转移到SoftMax等非线性功能。加速软玛克斯由于其非强度的非线性性质而具有挑战性,这是最苛刻的步骤。为了解决这个问题,我们设计了一个基于Schraudolph方法的新型近似算法的定制算术块,利用了一种新颖的近似算法,并通过自定义指导集(ISA)架构的compute集群的RIS ...
大规模的文本对图像(T2I)模型已在创意领域迅速获得突出,从而从文本提示中产生了令人信服的输出。但是,控制这些模型以确保一致的样式仍然具有挑战性,现有方法需要微调和手动干预才能解散内容和样式。在本文中,我们介绍了StyleLealed,这是一种新型技术,旨在在一系列生成的图像中建立风格对齐 ...
现在,即使对于复杂的掌握,手动运动捕获数据现在相对容易获得。但是,该数据的使用有限,没有能力将其重新定位到特定角色或机器人的手中。目标手可能在几何形状,自由度(DOF)或手指数方面差异很大。我们提出了一个简单但有效的框架,能够从公开可用的数据集将多个人体对象操作重新定位到各种运动学和形态学上多样化的目标手,并通过剥削接触区域的利用 ...
人类和机器人的动态运动是由姿势依赖性的非线性相互作用在自由度之间的广泛驱动的。但是,在研究人类运动产生的机制时,这些动力学效应仍被忽视。受最近作品的启发,我们假设人类运动计划为地球协同序列,因此对应于用分段最小能量实现的协调关节运动 ...
最近,基于 Transformer 的模型通过利用自我注意力的机制来具有高级云的理解,但是,这些方法通常忽略了较不突出区域的潜在信息,从而提高了对扰动的敏感性和有限的全球理解。为了解决这个问题,我们引入了PointAcl,这是一个旨在解决这些局限性的注意力驱动的对比学习框架。我们的方法采用了注意力驱动的动态掩盖策略,该策略指导模型专注于不足的区域,从而增强对点云中全球结构的理解 ...