arxiv T2I-Copilot: A Training-Free Multi-Agent Text-to-Image System for Enhanced Prompt Interpretation and Interactive Generation

名称
T2I-Copilot: A Training-Free Multi-Agent Text-to-Image System for Enhanced Prompt Interpretation and Interactive Generation
首页
https://yiyibooks.cn/arxiv/2507.20536v2/index.html
原始地址
https://arxiv.org/abs/2507.20536
描述
文本对图像(T2I)生成模型已彻底改变了内容的创建,但仍需提示措辞,通常要求用户在没有明确反馈的情况下多次重复提示。尽管诸如自动及时工程,受控文本嵌入,降解和多转弯产生等技术减轻了这些问题,但它们提供了有限的可控性,或者通常需要进行其他培训,从而限制了概括能力。因此,我们介绍了T2i-CopiLot,这是一种无训练的多代理系统,利用(多模式)大语言模型之间的协作来自动化及时措辞,模型选择和迭代性改进 ...