个性化的图像生成在将内容适应新颖概念方面取得了长足的进步。但是,持续的挑战仍然存在:平衡对未见概念的准确重建,并根据提示需要编辑能力,尤其是在处理复杂的面部特征差异时。在这项研究中,我们深入研究了文本形象调节过程的时间动态,强调了舞台分配在引入新概念中的关键作用 ...
0 0 0 2025/03/12 arXiv:2412.15674v1 jeft
多模式学习是人工智能中快速发展的领域,试图通过整合和分析各种类型的数据(包括文本,图像,音频和视频)来构建更广泛和健壮的系统。受到人类通过多种感官吸收信息的能力的启发,此方法可以实现诸如文本到视频转换,视觉问题的回答和图像字幕之类的应用程序。在此概述中,强调了支持多模式模型(MLLM)的数据集中的最新发展 ...
0 0 0 2025/03/12 arXiv:2412.17759v1 my_lsz
强化学习(RL)提供了一种建模和训练AI代理的通用方法,包括人类的相互作用方案。在本文中,我们提出了Sharpie(交互式实验的共享人类增强学习平台),以满足对支持RL代理和人类实验的通用框架的需求。它的模块化设计由用于RL环境和算法库的多功能包装器,面向参与者的Web界面,日志记录实用程序,在流行云上部署以及参与者招聘平台 ...
0 0 0 2025/03/12 arXiv:2501.19245v2 1424089348
代码调试是软件开发的重要阶段,对于确保代码生成任务中大语言模型(LLM)的可靠性和性能至关重要。人类调试通常遵循多阶段过程,其中包括错误本地化,错误标识,代码修复和代码识别。但是,现有的代码调试基准主要集中在代码维修阶段,该阶段仅提供有限的观点,可以评估LLMS的调试功能 ...
0 0 0 2025/03/12 arXiv:2408.05006v3 owenzds
有限体积外推是从晶格计算中提取物理可观察物的重要步骤。但是,对于具有远距离相互作用的系统而言,这是一个重大挑战。我们采用符号回归来回归有限体积的外推公式,以进行短程和远程相互作用 ...
0 0 0 2025/03/12 arXiv:2503.06496v1 amen668
在使用3D激光雷达传感器的3D感知领域中,地面分割是各种目的的必不可少的任务,例如可穿越的区域检测和对象识别。在这种情况下,已经提出了几种地面分割方法。但是,仍然遇到一些限制 ...
0 0 0 2025/03/12 arXiv:2207.11919v2 hulin01
大型语言模型(LLMS)显示了将自然语言问题转化为SQL查询(文本到SQL)的最新结果,这是数据库社区内的长期挑战。但是,安全问题仍然在很大程度上没有探索,尤其是后门攻击的威胁,这可以通过使用中毒数据集进行微调将恶意行为引入模型中。在这项工作中,我们系统地研究了基于LLM的文本到SQL模型的漏洞,并呈现ToxicsQL,这是一种新型的后门攻击框架 ...
0 0 0 2025/03/12 arXiv:2503.05445v1 elastic
模数转换器(ADC)允许使用数字硬件处理物理信号。它们的转换由两个阶段组成:采样,将连续时间信号映射到离散时间和量化中,即 ...
0 0 0 2025/03/12 arXiv:2201.12634v1 guoyao

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)