生成AI的最新进展加速了新型化学物质和材料的发现。但是,将这些发现过渡到工业规模的生产仍然是一个关键的瓶颈,因为它需要开发全新的化学制造工艺。当前的AI方法在遵守工程限制的同时,尽管它们在缩放化学过程中的作用至关重要,但仍无法自动产生PFD或PID。我们为自动生成工业可行的PFD和PID提供了一个封闭的循环,物理意识框架 ...
0 0 0 2025/06/23 arXiv:2505.24584v2 jhwei
近年来,将知识图纳入推荐系统已引起人们的关注。通过探索知识图内的互链接,可以将用户和项目之间的连接作为路径发现,从而为用户项目交互提供丰富而互补的信息。这种连接不仅揭示了实体和关系的语义,而且有助于理解用户的兴趣 ...
0 0 0 2025/06/23 arXiv:1811.04540v1 yyyyy
尽管图像压缩是视觉数据处理的基础,并且启发了许多标准和学习的编解码器,但这些方法仍然以每个像素极低的位数遭受严重的质量降解。尽管最近基于扩散的模型在低比特率下提供了增强的生成性能,但由于多个脱氧步骤,它们仍然产生有限的感知质量和过度的解码潜伏期。在本文中,我们提出了图像压缩(DIFFO)的第一个单步扩散模型,该模型在超低比特率下提供了高感知质量和快速解码 ...
0 0 0 2025/06/23 arXiv:2506.16572v1 1150501302
使用大语言模型(LLMS)在机器人控制中的最新进展表现出了巨大的潜力,这主要是由于LLMS了解自然语言命令并以各种语言生成可执行计划的能力。但是,在涉及移动机器人(尤其是无人机)的实时和交互应用中,LLMS固有的顺序 Token 生成过程引入了大量延迟,即 ...
0 0 0 2025/06/23 arXiv:2312.14950v2 xsxsxsxsxs
DCE-MRI中的乳腺癌病变细分由于异质性肿瘤形态和模糊边界,仍然具有挑战性。为了应对这些挑战,本研究提出了一个新型的杂种网络HCMA-UNET,用于乳腺癌的病变分割。我们的网络由轻巧的CNN骨干和一个多视图轴向自我发作Mamba(Mism)模块组成 ...
0 0 0 2025/06/23 arXiv:2501.00751v2 zfk666
多模式大型语言模型(MLLM)具有严重的安全性,使用由文本和其他模式的数据组成的多模式数据集的HTTP URL安全对准可以有效地增强MLLM的安全性,构造这些数据集是昂贵的。现有的低资源安全对准方法(包括文本一致性)已被发现与其他模式相比的安全风险挣扎。为了解决这个问题,我们提出了合成嵌入增强安全对齐(SEA)的嵌入,该渐变更新优化了其他模态的嵌入,以扩展文本数据集 ...
0 0 0 2025/06/23 arXiv:2502.12562v3 crazy
大视觉语言模型(LVLM)由于具有理解图像和视频的卓越视觉推理能力,在自动驾驶领域受到了广泛关注,极大地推动了可解释的端到端自动驾驶的发展。然而,目前对LVLM的评估主要集中在常见场景下的多方面能力,缺乏自动驾驶环境下的可量化和自动化评估,更不用说即使是最先进的自动驾驶感知系统也难以应对的严峻路况。处理。在本文中,我们提出了 CODA-LM,一种新颖的自动驾驶视觉语言基准,它为可解释的自动驾驶提供 ...
0 0 0 2025/06/23 arXiv:2404.10595v5 zlheos
受到预先训练的2D扩散模型的可用性日益增长的鼓励,通过利用评分蒸馏采样(SDS)的图像到3D的生成正在取得显着的进步。大多数现有方法结合了2D扩散模型的新颖视图提升,这些模型通常以参考图像为条件,同时在参考视图上应用硬L2图像监督。然而,密切遵守图像很容易损坏2D扩散模型的归纳知识,从而经常经常导致平坦或扭曲的3D一代 ...
0 0 0 2025/06/23 arXiv:2403.10395v1 bing0037

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)