最近,人们对将大语言模型(LLM)的成功从文本扩展到分子引起了人们的兴趣。大多数现有方法都采用图形神经网络来表示分子作为一系列分子语言比对的节点 Token ,但是,该图形忽略了分子中固有的层次结构。值得注意的是,高阶分子结构包含官能基的丰富语义,它们编码了分子的关键生化功能 ...
0 0 0 2025/07/02 arXiv:2406.14021v2 TJ
视频生成的最新进展激发了视频编辑技术的开发,可以将其分为基于反演和端到端的方法。但是,当前的视频编辑方法仍然面临一些挑战。基于反演的方法虽然是无训练和灵活的,但在推断期间却耗时,与细粒度的编辑说明挣扎,并产生人工制品和抖动 ...
0 0 0 2025/07/02 arXiv:2502.06734v3 Lewandofski
由于它们的二次计算复杂性,在 Transformer 中的自我注意力具有很高的计算成本,但是它们在解决语言和视觉问题方面的有效性引发了广泛的研究,旨在提高其效率。但是,跨越多个输入域的各种实验条件仅根据报告的结果进行公平比较,从而对模型选择提出了挑战。为了解决此差距,我们对图像分类进行了45个以上模型的大规模基准,评估关键效率方面,包括准确性,速度和内存使用情况 ...
0 0 0 2025/07/02 arXiv:2308.09372v4 yanyu
大语言模型(LLM)的一致性严重取决于接受昂贵人类偏好数据训练的奖励模型。尽管最近的工作探索了通过AI反馈绕过这一成本的探索,但这些方法通常缺乏严格的理论基础。在本文中,我们发现,通过标准的下一步预测培训的任何LLM中,强大的通才奖励模型已经潜在地存在 ...
0 0 0 2025/07/02 arXiv:2506.23235v1 18812680264
对LLM在化学中所起的作用的兴趣越来越大,这会导致人们越来越关注针对化学领域的LLMS基准的开发,以评估LLM在类型和复杂性各种化学任务中的性能。但是,该领域中的现有基准无法充分满足化学研究专业人员的具体要求。为此,我们提出了\ textbf {\ textit {chemeval}},该{chemeval}}对LLM在广泛的化学域任务中的功能进行了全面评估 ...
0 0 0 2025/07/02 arXiv:2409.13989v1 DoubleSails
大型语言模型(LLMS),例如Chatgpt,已经表现出巨大的潜力,但也引入了与内容限制和潜在滥用有关的挑战。我们的研究调查了三个关键的研究问题:(1)可以越狱LLM的不同提示类型的数量,(2)越狱提示在规避LLM限制的有效性,以及(3)Chatgpt在这些越狱提示中的弹性。最初,我们开发了一个分类模型,以分析现有提示的分布,确定十种不同的模式和三种越狱提示 ...
0 0 0 2025/07/02 arXiv:2305.13860v2 wutianrui
在这项工作中,我们介绍了第一个用于实时,音频驱动的肖像画的自动回归框架,又名Talking Head ...
0 0 0 2025/07/02 arXiv:2503.18429v1 ReLU
基于CNN的主要CNN方法用于跨视图图像地理位置定位依赖于极性变换,并且无法模拟全局相关性。我们提出了一种基于 Transformer 的方法(Transgeo),以从不同的角度解决这些局限性。 Transgeo充分利用了与全球信息建模和明确位置信息编码相关的 Transformer 的优势 ...
0 0 0 2025/07/02 arXiv:2204.00097v1 xxxx

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)