大型语言模型(llm)已展现出令人印象深刻的泛化未知任务的能力。在命名实体识别( ner)任务中,最近的进展表明,通过采用以实体为中心的模式,通过指令调整 ...
0 0 0 2025/04/17 arXiv:2402.16602v2 wld
我们介绍了Falcon系列:7b,40b和180b参数,仅因素模型,该模型训练了以不同的高质量语料库为主要由Web数据组装而来的高质量语料库。最大的型号Falcon-180B已接受了3.5万亿 Token 的培训,该文本是最大的公开记录的预算训练 ...
0 0 0 2025/04/17 arXiv:2311.16867v2 killerman028
为了解决自然语言中大型语言模型性能对 SQL 任务的挑战,我们引入了 XiYan-SQL,这是一种创新框架,采用多生成器集成策略来改进候选生成。我们介绍 M-Schema,一种半结构化模式表示方法,旨在增强对数据库结构的理解。为了提高生成的候选 SQL 查询的质量和多样性,XiYan-SQL 将上下文学习 (ICL) 的巨大潜力与监督微调的精确控制相结合 ...
0 1 0 2025/04/17 arXiv:2411.08599v3 luck
将知识从标记的源域中学到的知识转移到无监督域适应(UDA)的原始目标域(UDA)对于自动驾驶系统的可扩展部署至关重要。 UDA中的最新方法通常采用一个关键思想:利用来自源和目标域的联合监督信号进行自我训练。在这项工作中,我们改善并扩展了这一方面 ...
0 0 0 2025/04/17 arXiv:2111.15242v3 15966829631
本文提出了一种有效分割图像的新方法,这些方法可以集成到任何模型和方法论中。我们选择的范式是用于1900检测的医学图像(3-D胸CT扫描)的分类。我们的方法包括视觉模型的组合,这些模型将CT扫描分割,然后将其馈送到一个名为Racnet的深层神经结构中,以进行COVID-19的检测。特别是,引入了一个名为SAM2Clip2SAM的新型框架进行分割,以利用各个段的任何模型(SAM)和对比性语言图像预训练 ...
0 0 0 2025/04/17 arXiv:2407.15728v2 Atlantis
低功能环境是几何计算机视觉(CV)算法的主要跟腱之一。在大多数人类制造的场景通常具有低特征的场景中,可以将线路视为对点的补充。在本文中,我们提出了使用点和线路功能的多机器人合作视觉惯性导航系统(VIN) ...
0 0 0 2025/04/17 arXiv:2311.05717v1 parsifalster
随着意图的变化,我们如何更新用户意图的AI内存?我们考虑AI接口如何有助于将新信息集成到自然语言数据的存储库中。受影响分析等软件工程概念的启发,我们开发了使用非本地效应管理语义变化的UI,我们称之为“语义冲突解决”。用户对项目提出了新的意图 - 进行“语义提交”  -  AI可帮助用户在代表其意图的现有信息的商店内检测和解决语义冲突(“意图规范”) ...
0 0 0 2025/04/17 arXiv:2504.09283v1 woodman
采用电动汽车(EV)被认为对实现气候目标至关重要,但它取决于消费者的兴趣。这项研究探讨了公众购买电动汽车的意图如何与四个未经审查的因素相关:接触电动汽车信息,对电动汽车的环境利益的看法,对政府气候政策的看法以及对未来EV基础设施的信心;在控制先前的EV所有权,政治隶属关系和人口特征的同时(例如 ...
0 0 0 2025/04/17 arXiv:2504.09854v1 woodman

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)