一译 —— 文档和论文翻译、对照阅读、讨论和社区

AutoChemSchematic AI: A Closed-Loop, Physics-Aware Agentic Framework for Auto-Generating Chemical Process and Instrumentation Diagrams

生成AI的最新进展加速了新型化学物质和材料的发现。但是，将这些发现过渡到工业规模的生产仍然是一个关键的瓶颈，因为它需要开发全新的化学制造工艺。当前的AI方法在遵守工程限制的同时，尽管它们在缩放化学过程中的作用至关重要，但仍无法自动产生PFD或PID。我们为自动生成工业可行的PFD和PID提供了一个封闭的循环，物理意识框架 ...

0 0 0 2025/06/23 arXiv:2505.24584v2 jhwei

Explainable Reasoning over Knowledge Graphs for Recommendation

近年来，将知识图纳入推荐系统已引起人们的关注。通过探索知识图内的互链接，可以将用户和项目之间的连接作为路径发现，从而为用户项目交互提供丰富而互补的信息。这种连接不仅揭示了实体和关系的语义，而且有助于理解用户的兴趣 ...

0 0 0 2025/06/23 arXiv:1811.04540v1 yyyyy

DiffO: Single-step Diffusion for Image Compression at Ultra-Low Bitrates

尽管图像压缩是视觉数据处理的基础，并且启发了许多标准和学习的编解码器，但这些方法仍然以每个像素极低的位数遭受严重的质量降解。尽管最近基于扩散的模型在低比特率下提供了增强的生成性能，但由于多个脱氧步骤，它们仍然产生有限的感知质量和过度的解码潜伏期。在本文中，我们提出了图像压缩（DIFFO）的第一个单步扩散模型，该模型在超低比特率下提供了高感知质量和快速解码 ...

0 0 0 2025/06/23 arXiv:2506.16572v1 1150501302

TypeFly: Flying Drones with Large Language Model

使用大语言模型（LLMS）在机器人控制中的最新进展表现出了巨大的潜力，这主要是由于LLMS了解自然语言命令并以各种语言生成可执行计划的能力。但是，在涉及移动机器人（尤其是无人机）的实时和交互应用中，LLMS固有的顺序 Token 生成过程引入了大量延迟，即 ...

0 0 0 2025/06/23 arXiv:2312.14950v2 xsxsxsxsxs

HCMA-UNet: A Hybrid CNN-Mamba UNet with Axial Self-Attention for Efficient Breast Cancer Segmentation

DCE-MRI中的乳腺癌病变细分由于异质性肿瘤形态和模糊边界，仍然具有挑战性。为了应对这些挑战，本研究提出了一个新型的杂种网络HCMA-UNET，用于乳腺癌的病变分割。我们的网络由轻巧的CNN骨干和一个多视图轴向自我发作Mamba（Mism）模块组成 ...

0 0 0 2025/06/23 arXiv:2501.00751v2 zfk666

SEA: Low-Resource Safety Alignment for Multimodal Large Language Models via Synthetic Embeddings

多模式大型语言模型（MLLM）具有严重的安全性，使用由文本和其他模式的数据组成的多模式数据集的HTTP URL安全对准可以有效地增强MLLM的安全性，构造这些数据集是昂贵的。现有的低资源安全对准方法（包括文本一致性）已被发现与其他模式相比的安全风险挣扎。为了解决这个问题，我们提出了合成嵌入增强安全对齐（SEA）的嵌入，该渐变更新优化了其他模态的嵌入，以扩展文本数据集 ...

0 0 0 2025/06/23 arXiv:2502.12562v3 crazy

Automated Evaluation of Large Vision-Language Models on Self-driving Corner Cases

大视觉语言模型（LVLM）由于具有理解图像和视频的卓越视觉推理能力，在自动驾驶领域受到了广泛关注，极大地推动了可解释的端到端自动驾驶的发展。然而，目前对LVLM的评估主要集中在常见场景下的多方面能力，缺乏自动驾驶环境下的可量化和自动化评估，更不用说即使是最先进的自动驾驶感知系统也难以应对的严峻路况。处理。在本文中，我们提出了 CODA-LM，一种新颖的自动驾驶视觉语言基准，它为可解释的自动驾驶提供 ...

0 0 0 2025/06/23 arXiv:2404.10595v5 zlheos

Isotropic3D: Image-to-3D Generation Based on a Single CLIP Embedding

受到预先训练的2D扩散模型的可用性日益增长的鼓励，通过利用评分蒸馏采样（SDS）的图像到3D的生成正在取得显着的进步。大多数现有方法结合了2D扩散模型的新颖视图提升，这些模型通常以参考图像为条件，同时在参考视图上应用硬L2图像监督。然而，密切遵守图像很容易损坏2D扩散模型的归纳知识，从而经常经常导致平坦或扭曲的3D一代 ...

0 0 0 2025/06/23 arXiv:2403.10395v1 bing0037

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）