Mixtral是一种代表性的稀疏专家混合(SMoE)语言模型,由于其独特的模型设计和优越的性能而受到广泛关注。在Mixtral-8x7B-v0.1的基础上,本文提出了Chinese-Mixtral和Chinese-Mixtral-Instruct,通过进一步的预训练和指令微调,提高了汉语能力 ...
0 0 0 2024/05/03 arXiv:2403.01851v1 mlp
指令调优有潜力激发或增强大型语言模型 (LLM) 的特定功能。然而,实现数据的正确平衡对于防止灾难性遗忘和任务之间的干扰至关重要。为了解决这些限制并提高训练灵活性,我们提出了 Mixture-of-LoRAs (MoA) 架构,这是一种新颖且参数高效的调整方法,专为 LLM 的多任务学习而设计 ...
0 0 0 2024/05/03 arXiv:2403.03432v1 mlp
现有的基于学习的自动驾驶(AD)系统在理解高级信息、概括罕见事件和提供可解释性方面面临挑战。为了解决这些问题,这项工作采用大型语言模型 (LLM) 作为需要人类常识理解的复杂 AD 场景的决策组件。我们设计认知途径来实现 LLM 的全面推理,并开发算法将 LLM 的决策转化为可操作的驾驶命令 ...
0 0 0 2024/05/03 arXiv:2310.03026v2 卡崩卡
基于梯度的规划器广泛用于四旋翼局部规划,其中欧几里德符号距离场(ESDF)对于评估梯度大小和方向至关重要。然而,计算这样的场具有很多冗余,因为轨迹优化过程仅覆盖 ESDF 更新范围的非常有限的子空间。本文提出了一种无 ESDF 的基于梯度的规划框架,显着减少了计算时间 ...
0 0 0 2024/05/03 arXiv:2008.08835v2 yyyp
有机反应通常被归为包含具有相似试剂和机制的反应的类别。反应类有助于复杂概念的交流和化学反应空间的有效导航。然而,分类过程是一项繁琐的任务 ...
0 0 0 2024/05/03 arXiv:2012.06051v1 pdssunny
知识图大规模表示复杂关系的能力使其能够满足各种需求,包括知识表示、问答和推荐系统。知识图谱所表示的信息通常是不完整的,因此需要知识图谱补全任务。预训练和微调的语言模型在这些任务中显示出了前景,尽管这些模型忽略了知识图中编码的内在信息,即实体和关系类型 ...
0 0 0 2024/05/03 arXiv:2211.02744v2 Cantaloupe
规划受控自我车辆的轨迹是自动驾驶的一个关键挑战。对于人类驾驶员来说,预测周围车辆的运动对于规划自己的行动非常重要。最近的运动预测方法利用等变神经网络来利用场景中的几何对称性 ...
0 0 0 2024/05/03 arXiv:2403.11304v1 yyyp
尽管大型语言模型(LLM)在各种任务中取得了显着的成功,但它们经常与幻觉问题作斗争,特别是在需要深度和负责任的推理的场景中。这些问题可以通过在 LLM 推理中引入外部知识图(KG)来部分解决。在本文中,我们提出了一种新的LLM-KG集成范式“$\hbox{LLM}\otimes\hbox{KG}$”,它将LLM视为一个代理,以交互方式探索KG上的相关实体和关系并执行推理基于检索到的知识 ...
0 0 0 2024/05/03 arXiv:2307.07697v6 beaver

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)