一译 —— 文档和论文翻译、对照阅读、讨论和社区

Sparse Meets Dense: Unified Generative Recommendations with Cascaded Sparse-Dense Representations

最近，通过直接从用户交互序列预测项目标识符的情况下，生成模型在推荐系统中引起了人们的关注。但是，由于量化和序列建模等各个阶段的分离，现有方法遭受了严重的信息损失，从而阻碍了其实现顺序致密检索技术的建模精度和准确性的能力。整合生成和密集的检索方法仍然是一个关键挑战 ...

0 0 0 2025/03/09 arXiv:2503.02453v1 pzh_hust

Multi-modal Machine Learning in Engineering Design: A Review and Future Directions

（mmml）领域 ...

0 1 0 2025/03/09 arXiv:2302.10909v2 jiangyh

Inst3D-LMM: Instance-Aware 3D Scene Understanding with Multi-modal Instruction Tuning

尽管在3D场景的理解中取得了令人鼓舞的进展，但开发有效的大型多模式模型（LMM）仍然具有挑战性，该模型能够在复杂的3D环境中理解和推理。大多数以前的方法通常编码3D点和2D图像特征，从而忽略了2D语义和3D对象属性之间的相互作用，以及3D环境中的空间关系。这种限制不仅阻碍了3D场景的全面表示，还损害了培训和推理效率 ...

0 0 0 2025/03/09 arXiv:2503.00513v1 漏视野

Calib3D: Calibrating Model Preferences for Reliable 3D Scene Understanding

关键的3D场景理解任务不仅需要准确的，而且需要从3D感知模型中进行的自信预测。这项研究介绍了Calib3d，这是一种开创性的努力，从不确定性估计的角度来对3D场景理解模型的可靠性进行基准和审查。我们全面评估了10种不同3D数据集中的28种最先进的模型，从而揭示了有见地的现象，这些现象应对3D场景理解中的质地和认知不确定性 ...

0 0 0 2025/03/09 arXiv:2403.17010v3 漏视野

Understanding Factual Errors in Summarization: Errors, Summarizers, Datasets, Error Detectors

已经对抽象性摘要模型的倾向进行了广泛的研究，包括设计指标以检测当前系统输出中错误的错误和误差的注释。但是，汇总系统，指标和注释的基准的不断发展的性质使事实评估成为移动的目标，并且在指标之间进行明确的比较变得越来越困难。在这项工作中，我们汇总了九个现有数据集中的事实错误注释，并根据基础摘要模型对其进行分层 ...

0 0 0 2025/03/09 arXiv:2205.12854v2 piupiu

TB-HSU: Hierarchical 3D Scene Understanding with Contextual Affordances

功能和负担能力的概念是3D场景理解的关键方面，并支持面向任务的目标。在这项工作中，我们开发了一个模型，该模型学会在代表场景的空间组织的3D层次场景图中构建和改变功能负担。不同的功能负担旨在与图表的不同空间上下文集成 ...

0 0 0 2025/03/09 arXiv:2412.05596v2 漏视野

Lexicon3D: Probing Visual Foundation Models for Complex 3D Scene Understanding

复杂的 3D 场景理解越来越受到关注，场景编码策略在这一成功中发挥着至关重要的作用。然而，各种场景的最佳场景编码策略仍不清楚，特别是与基于图像的对应策略相比。为了解决这个问题，我们提出了一项全面的研究，探索用于 3D 场景理解的各种视觉编码模型，确定每个模型在不同场景中的优势和局限性 ...

0 0 0 2025/03/09 arXiv:2409.03757v2 漏视野

Duoduo CLIP: Efficient 3D Understanding with Multi-View Images

我们介绍了Duoduo剪辑，这是一种用于3D表示学习的模型，该模型从多视图图像而不是点云中学习形状编码。多视图图像的选择使我们能够利用现成的剪辑模型的2D先验，以促进3D数据进行微调。与现有的点云方法相比，我们的方法不仅显示出更好的概括，而且还减少了GPU的要求和培训时间 ...

0 0 0 2025/03/09 arXiv:2406.11579v2 漏视野

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）