多目标增强学习(MORL)试图制定同时优化多个冲突目标的政策,但需要广泛的在线互动。 Offline Morl通过对预采用的数据集进行培训,从而提供了有希望的解决方案,以推广到部署的任何偏好。但是,现实世界中的离线数据集通常是保守和狭窄的分布,未能全面涵盖偏好,从而导致出现偏离(OOD)偏好领域 ...
0 0 0 2025/05/03 arXiv:2408.15501v1 微生心月
从数据分布的简化连续性假设中得出的高级生成模型(例如,扩散模型),尽管表现出有希望的进度,但由于分子几何的多模态性和对噪声敏感性的性质,很难直接应用于几何生成应用 ...
0 0 0 2025/05/02 arXiv:2403.15441v1 alex666
蛋白质家族设计是一种有希望的替代方法,它通过结合了从头蛋白设计的优势和基于突变的基于此论文的优势,我们提出了本文,我们提出了profilebfn,概述贝叶斯流动网络,用于蛋白质家族的特殊生成性建模。 ProfileBFN从MSA配置文件的角度扩展了离散的贝叶斯流动网络,可以通过将其作为退化曲线来对单个蛋白质序列进行训练,从而通过避免大规模的MSA数据构建和培训来实现有效的蛋白质家庭设计。经验结果表 ...
0 0 0 2025/05/02 arXiv:2502.07671v2 alex666
微调视觉语言模型(VLM)的最新进展见证了迅速调整和适配器调整的成功,而对固有参数的经典模型进行了微调。据信,通过微调剪辑模型甚至会降低性能,对VLM的微调参数进行了几次损坏。在本文中,我们重新审视了这个观点,并提出了一个新的视角:对特定参数进行微调,而不是所有参数,将发现VLMS上经典模型的功能 ...
0 0 0 2025/05/02 arXiv:2409.16718v2 Jht
利用9,439份AI论文(2020年1月至2025年3月)的1,178份安全性和可靠性文件,我们比较了领先的AI公司(拟人化,Google Deepmind,Meta,Microsoft和OpenAI)和AI大学(CMU,MU,MIT,MIT,NYU,NYU,Stanford,Stanford,Stanford,UC Berkeley和Washington)的研究成果。我们发现,企业AI研究越来越 ...
0 0 0 2025/05/02 arXiv:2505.00174v1 tmylla
基于循证的深度学习代表了不确定性估计的新兴范式,并提供可靠的预测,并具有可靠的额外计算开销。现有方法通常采用kullback-leibler差异来估计网络预测的不确定性,忽略了各种方式之间的域间隙。为了解决这个问题,本文介绍了一种基于HölderDivergence(HD)的新颖算法,以通过解决不完整或嘈杂数据固有的不确定性挑战来提高多视图学习的可靠性 ...
0 0 0 2025/05/02 arXiv:2411.00826v2 cwd
本文考虑了矩阵完成问题。我们表明,没有必要假设关节不一致,这是先前研究所施加的标准但不直觉和限制性条件。这会导致相对于不一致的参数(以及等级$ r $和矩阵dimension $ n $ to log factor to log factor)的样本复杂性绑定,该示例复杂性是最佳的 ...
0 0 0 2025/05/02 arXiv:1310.0154v4 morri
代码审查包括评估队友编写的代码,以提高代码质量。实证研究记录了这种做法带来的好处,但是在开发人员的时间方面,其付出了代价。因此,研究人员提出了技术和工具来自动化代码审核任务,例如审阅者选择(i ...
0 0 0 2025/05/02 arXiv:2503.09510v1 yexxok

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)