传统的图像拼接方法倾向于利用日益复杂的几何特征(点、线、边缘等)来获得更好的性能。然而,这些手工制作的特征仅适用于具有足够几何结构的特定自然场景 ...
0 0 0 2024/04/25 arXiv:2302.08207v2 study
修饰图像是增强照片视觉吸引力的重要方面。尽管用户通常具有共同的审美偏好,但他们的修饰方法可能会根据个人喜好而有所不同。因此,需要一种白盒方法来产生令人满意的结果,并使用户能够同时方便地编辑图像 ...
0 0 0 2024/04/25 arXiv:2303.08682v2 bnexx
我们研究如何将在互联网规模数据上训练的视觉语言模型直接纳入端到端机器人控制中,以促进泛化并实现紧急语义推理。我们的目标是使单个端到端训练模型能够学习将机器人观察映射到动作,并享受对来自网络的语言和视觉语言数据进行大规模预训练的好处。为此,我们建议在机器人轨迹数据和互联网规模的视觉语言任务(例如视觉问答)上共同微调最先进的视觉语言模型 ...
0 0 0 2024/04/25 arXiv:2307.15818v1 czvzb
本报告调查了生成模型以及联网和自动驾驶汽车 (CAV) 的历史和影响,这两种推动技术和交通进步的突破性力量。通过重点关注生成模型在 CAV 背景下的应用,该研究旨在揭示这种集成如何增强自动驾驶汽车的预测建模、模拟准确性和决策过程。本文讨论了在交通运输中集成生成模型和 CAV 技术的好处和挑战 ...
0 0 0 2024/04/25 arXiv:2403.10559v1 838348914
ChatGPT 和 Bard 等大型语言模型 (LLM) 彻底改变了自然语言的理解和生成。他们拥有深厚的语言理解能力、类人的文本生成能力、情境意识和强大的解决问题的能力,这使得他们在各个领域(例如,人工智能)都具有无价的价值 ...
0 0 0 2024/04/25 arXiv:2312.02003v3 zzyx
大型语言模型 (LLM) 因其在理解和生成类人文本方面的卓越能力而彻底改变了人工智能 (AI) 服务。尤其是 LLM 聊天机器人已得到广泛采用,改变了人机交互。然而,这些 LLM 聊天机器人很容易受到“越狱”攻击,即恶意用户操纵提示来引发不适当或敏感的响应,从而违反服务策略 ...
0 0 0 2024/04/25 arXiv:2307.08715v2 zzyx
大型语言模型 (LLM) 很容易受到越狱攻击,从而导致有害、不道德或有偏见的文本生成。然而,现有的越狱方法的计算成本很高。在本文中,我们提出了从弱到强的越狱攻击,这是一种攻击对齐的 LLM 以产生有害文本的有效方法 ...
0 0 0 2024/04/25 arXiv:2401.17256v2 zzyx
半监督学习已被证明是利用未标记数据来减轻对大型标记数据集的依赖的强大范例。在这项工作中,我们统一了当前半监督学习的主流方法,以产生一种新算法 MixMatch,该算法通过猜测数据增强的未标记示例的低熵标签并使用 MixUp 混合标记和未标记数据来工作。我们表明,MixMatch 在许多数据集和标记数据量中大幅获得了最先进的结果 ...
0 0 0 2024/04/25 arXiv:1905.02249v2 豆芽ya

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)