有效的缩放和灵活的任务接口使大型语言模型能够在许多任务上脱颖而出。我们提出了Pali(Pathways语言和图像模型),该模型将这种方法扩展到语言和视觉的联合建模。帕利(Pali)基于视觉和文本输入生成文本,并且此接口以许多语言执行许多视觉,语言和多模式任务 ...
0 0 0 2025/03/25 arXiv:2209.06794v4 shiwei
精确从数字化的3D牙科模型中细分牙齿的能力是计算机辅助正畸手术计划中的重要任务。迄今为止,基于深度学习的方法已被普遍用于处理此任务。最新的方法直接将3D输入的原始属性(即网状细胞的坐标和正常向量)训练,以训练一个单际网络进行完全自动化的牙齿分割 ...
0 0 0 2025/03/25 arXiv:2012.13697v1 zhuyuanxiang
本文将图像的变形与深度特征相结合。为此,图像被视为将图作为高维特征空间中的地图,并且在米勒,特鲁维,Younes和同事提出的变态模型中纳入了对结构敏感的各向异性流动正则化。对于此模型,提出了Riemannian路径能量的变异时间离散化,并证明了最小化该能量的离散地测地路路径的存在 ...
0 0 0 2025/03/25 arXiv:1910.12672v2 qiuyan
大语言模型(LLM)在许多任务上的性能受到了在预训练期间学到的知识并存储在模型参数中的知识的限制。低级适应性(LORA)是一种流行而有效的训练技术,用于更新LLM的特定于域的适应性。在这项研究中,我们研究了如何使用LORA将新事实纳入LLM,而不会损害先前学习的知识 ...
0 0 0 2025/03/25 arXiv:2502.14502v3 hanyu
大型语言模型(LLMS),例如Llama,在各种任务中都表现出色。然而,当部署到法律或医学等特定领域时,这些模型仍然面临着特定于领域知识缺乏的挑战,并且能力不足以利用这些知识来解决与域相关的问题。在本文中,我们提出了一个新框架,以根据此框架将LLMS调整到特定领域,并建立法律领域LLM的律师Llama ...
0 0 0 2025/03/25 arXiv:2305.15062v2 kkx
最近的研究强调了它们在某些简单任务中的熟练程度,例如通过各种推理策略写作和编码。但是,LLM代理商仍然在需要全面计划的任务上挣扎,这一过程挑战了当前的模型并仍然是一个关键的研究问题。在这项研究中,我们专注于旅行计划,一个多重计划问题,涉及多个相互联系的阶段,例如概述,信息收集和计划,通常以管理各种限制和不确定性的需要 ...
0 0 0 2025/03/25 arXiv:2405.18208v1 leesongzero
推荐系统(RS)旨在为每个用户生成个性化排名列表,并使用排名指标进行评估。尽管个性化排名是RS的一个基本方面,但在模型体系结构的设计中,这种关键属性通常被忽略。为了解决此问题,我们提出了一个由排名启发的建议模型的RankFormer ...
0 0 0 2025/03/25 arXiv:2503.16927v1 liaozhongru
在语音处理中,非自动回旋(NAR)建模引起了越来越多的关注。借助最新的基于注意力的自动语音识别(ASR)结构,与自回归(AR)模型相比,NAR只能通过较小的准确性降解来实现有希望的实时因子(RTF)改进。但是,识别推理需要等待完整的语音说法的完成,这将其应用程序限制在低潜伏期方案上 ...
0 0 0 2025/03/25 arXiv:2107.09428v1 tiandiweizun

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)