The Responsible Foundation Model Development Cheatsheet: A Review of Tools & Resources

Longpre, Shayne; Biderman, Stella; Albalak, Alon; Schoelkopf, Hailey; McDuff, Daniel; Kapoor, Sayash; Klyman, Kevin; Lo, Kyle; Ilharco, Gabriel; San, Nay; Rauh, Maribeth; Skowron, Aviya; Vidgen, Bertie; Weidinger, Laura; Narayanan, Arvind; Sanh, Victor; Adelani, David; Liang, Percy; Bommasani, Rishi; Henderson, Peter; Luccioni, Sasha; Jernite, Yacine; Soldaini, Luca

摘要：基础模型的开发吸引了迅速扩大的贡献者、科学家和应用程序群体。为了帮助塑造负责任的开发实践，我们引入了基础模型开发速查表：涵盖文本、视觉和语音模式的 250 多种工具和资源，并且不断增长。我们利用大量先前的工作来调查资源（例如软件、文档、框架、指南和实用工具），这些资源支持明智的数据选择、处理和理解、精确和限制感知的工件文档、高效的模型训练、高级对训练对环境影响的认识，对能力、风险和声明的仔细模型评估，以及负责任的模型发布、许可和部署实践。我们希望这些精选的资源有助于指导更负责任的开发。整理这份清单的过程使我们能够回顾人工智能开发生态系统，揭示现有实践中严重缺失、误用或过度使用的工具。我们发现（i）数据源、模型评估和监控工具严重不能满足道德和现实世界的需求，（ii）模型安全性、能力和环境影响的评估都缺乏可重复性和透明度，（iii）文本分析，特别是以英语为中心的分析继续主导多语言和多模式分析，(iv) 需要对系统进行评估，而不仅仅是模型，以便在上下文中评估能力和影响。

Subjects:	Machine Learning (cs.LG); Artificial Intelligence (cs.AI); Computation and Language (cs.CL)
Cite as:	arXiv:2406.16746 [cs.LG]
	(or arXiv:2406.16746v1 [cs.LG] for this version)
	https://doi.org/10.48550/arXiv.2406.16746

计算机科学 > 机器学习

标题：负责任的基础模型开发速查表：工具和资源回顾

提交历史

访问文件：

参考文献和引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者的实验项目