- 名称
- Perception, Reason, Think, and Plan: A Survey on Large Multimodal Reasoning Models
- 描述
推理是智力的核心,塑造了做出决策,得出结论并跨越领域的能力。在人工智能中,随着系统越来越多地在开放,不确定和多模式环境中运行,推理对于实现鲁棒和适应性行为至关重要。大型多模式推理模型(LMRMS)已成为一种有希望的范式,将诸如文本,图像,音频和视频之类的模式集成在一起,以支持复杂的推理能力,并旨在获得全面的感知,精确的理解和深刻的推理 ...