信息性路径计划(IPP)是针对各种现实世界机器人应用(例如环境监视)的重要计划范例。 IPP涉及计划一条可以在遵守计划限制的同时,可以准确地了解兴趣数量的道路。传统的IPP方法通常需要在执行过程中进行较高的计算时间,从而产生增强学习(RL)的IPP方法 ...
0 0 0 2025/04/19 arXiv:2410.17186v1 hanju
在这项工作中,我们研究了素描引导的图像介绍的任务。与经过充分探索的自然语言指导图像介绍(在捕获语义细节方面擅长的图像)不同,相对较少的素描引导的介绍提供了更大的用户控制,以指定对象的形状并构成构图。作为该任务的早期解决方案之一,我们引入了一种新型的部分离散扩散过程(PDDP) ...
0 0 0 2025/04/19 arXiv:2404.11949v1 likelike
大型文本图像(T2I)模型的个性化技术允许用户从参考图像中合并新概念。但是,现有方法主要依赖文本描述,从而导致对定制图像的控制有限,并且无法支持细粒度和本地编辑(例如, ...
0 0 0 2025/04/19 arXiv:2402.17624v1 likelike
通过拥有不同专业知识和工具的多个代理的协作,多代理系统在解决现实世界问题方面取得了令人瞩目的进展。给定用户查询,元代理作为这些系统中的大脑,需要将查询分解为多个子任务,这些子任务可以分配给能够解决这些问题的合适代理,即所谓的面向代理的规划。在本研究中,我们确定了面向主体的规划的三个关键设计原则,包括可解决性、完整性和非冗余性,以确保每个子任务得到有效解决,从而对原始查询产生满意的响应 ...
0 0 0 2025/04/19 arXiv:2410.02189v2 xoxoal
场景图生成(SGG)在许多计算机视觉应用中提供了至关重要的结构化表示。但是,传统的SGG方法受到封闭式假设的限制,从而限制了他们仅识别预定义的对象和关系类别的能力。为了克服这一点,我们将SGG方案分为基于节点和边缘的四个不同的设置:封闭设置的SGG,开放词汇(对象)基于检测的SGG(OVD-SGG),基于开放的词汇关系的SGG(OVR-SGG),以及开放式词汇量检测 + RELAKERARY DE ...
0 0 0 2025/04/19 arXiv:2311.10988v2 蔡明方
社交媒体受欢迎程度(SMP)预测是一项复杂的任务,涉及多模式数据集成。尽管像剪辑这样的预训练的视觉模型(VLM)已被广泛用于此任务,但它们在捕获社交媒体内容的独特特征方面的有效性仍未得到探索。本文批判性地研究了基于夹的特征在SMP预测中的适用性,重点是社交媒体帖子中图像和文本之间的语义不一致现象 ...
0 0 0 2025/04/19 arXiv:2407.00556v1 ttwt
我们研究了在\ emph {sets}上定义的机器学习任务设计模型的问题。与在固定维矢量上操作的传统方法相反,我们考虑了在排列不变的集合中定义的目标功能。此类问题是普遍存在的,从对人口统计的估计\ cite {poczos13aistats},到堤防大坝的压力仪数据中的异常检测\ cite {jung15exploration},宇宙学到宇宙学\ cite \ cite \ cite {ntamp ...
0 0 0 2025/04/19 arXiv:1703.06114v3 flyaway
医学图像分割在推进疾病诊断和治疗计划的医疗系统中起着至关重要的作用。 U形体系结构(通常称为U-NET)已被证明在各种医学图像细分任务中已获得了非常成功的成功。但是,U-NET基于卷积的操作固有地限制了其有效建模远程依赖性的能力 ...
0 0 0 2025/04/19 arXiv:2310.07781v1 尼斯湖

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)