深度学习方法已被认为是在药物发现和材料设计中加速分子筛选的有望。由于标记数据的可用性有限,因此已经提出了各种自我监督的分子预训练方法。尽管许多现有方法在计算机视觉(CV)和自然语言处理(NLP)中采用了常见的预训练任务,但它们经常忽略有关分子的基本物理原则 ...
0 0 0 2025/05/03 arXiv:2407.11086v1 lulus
无监督的异常检测涵盖了在需要高通量和精度的工业环境中的各种应用。早期作品以一级模型范式为中心,这在大规模生产环境中构成了重大挑战。基于知识介绍的多级异常检测有望具有相当不错的性能,但与一级版本相比有显着下降 ...
0 0 0 2025/05/03 arXiv:2405.06467v1 wu33learn
流行文化是交流的重要方面。在社交媒体上,人们经常发布流行文化参考图像,将事件,产品或其他实体连接到流行文化领域。创建这些图像是一个创造性的挑战,需要在用户主题和流行文化领域之间找到概念上的联系 ...
0 0 0 2025/05/03 arXiv:2111.04920v3 jomei
从图表上的链接预测的角度来看,我们考虑了推荐系统的矩阵完成。诸如电影评分之类的交互数据可以通过二分的用户 - 项目图表示,其标记的边缘表示观察到的评分。在图形结构数据深度学习的最新进展的基础上,我们根据两部分相互作用图上的可区分消息提出了图形自动编码框架 ...
0 0 0 2025/05/03 arXiv:1706.02263v2 morri
在本文中,我们为3D视觉接地提出了有效的多级卷积体系结构。由于两阶段或基于点的体系结构,传统方法很难满足实时推断的要求。受到3D对象检测中多层完全稀疏卷积架构的成功的启发,我们旨在在此技术路线之后构建一个新的3D视觉接地框架 ...
0 0 0 2025/05/03 arXiv:2502.10392v2 yyyyyyyyy
大多数现有的跨模式检索方法的成功在很大程度上取决于以下假设:给定查询遵循源域的相同分布。但是,由于查询的复杂性和多样性,在实际情况下很容易违反这种假设,从而导致了查询转移问题。具体而言,查询偏移是指在线查询流源自与源源的不同分布之后的域 ...
0 1 0 2025/05/03 arXiv:2410.15624v1 likelc
扩散模型被广泛用于图像编辑任务。现有的编辑方法通常通过策划文本嵌入或分数空间中的编辑方向来设计表示操作过程。但是,这样的过程面临着一个关键的挑战:高估编辑强度会损害视觉一致性,而低估其未能使编辑任务失败 ...
0 0 0 2025/05/03 arXiv:2504.02828v1 assvga
最近的3d大型重建模型通常采用两阶段过程,包括首先通过多视图扩散模型生成多视图图像,然后利用前馈模型将图像重建为,3d内容。然而,多视图扩散模型通常会产生低质量且不一致的图像,从而对最终,3d重建的质量产生不利影响。为了解决这个问题,我们提出了一个名为循环3d的统一3d生成框架,它在多步扩散过程中循环利用基于2d扩散的生成模块和前馈3d3d重建模块... ...
0 0 0 2025/05/03 arXiv:2407.19548v1 hyx

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)