计算机科学 > 机器学习
[2024年6月24日提交]
标题:负责任的基础模型开发速查表:工具和资源回顾
查看题为“The Responsible Foundation Model Development Cheatsheet: A Review of Tools & Resources”的论文的 PDF,作者为 Shayne Longpre 和其他 22 位作者
查看PDF
摘要:基础模型的开发吸引了迅速扩大的贡献者、科学家和应用程序群体。 为了帮助塑造负责任的开发实践,我们引入了基础模型开发速查表:涵盖文本、视觉和语音模式的 250 多种工具和资源,并且不断增长。 我们利用大量先前的工作来调查资源(例如软件、文档、框架、指南和实用工具),这些资源支持明智的数据选择、处理和理解、精确和限制感知的工件文档、高效的模型训练、高级对训练对环境影响的认识,对能力、风险和声明的仔细模型评估,以及负责任的模型发布、许可和部署实践。 我们希望这些精选的资源有助于指导更负责任的开发。 整理这份清单的过程使我们能够回顾人工智能开发生态系统,揭示现有实践中严重缺失、误用或过度使用的工具。 我们发现(i)数据源、模型评估和监控工具严重不能满足道德和现实世界的需求,(ii)模型安全性、能力和环境影响的评估都缺乏可重复性和透明度,(iii)文本分析,特别是以英语为中心的分析继续主导多语言和多模式分析,(iv) 需要对系统进行评估,而不仅仅是模型,以便在上下文中评估能力和影响。
书目和引文工具
与本文相关的代码、数据和媒体
演示
推荐和搜索工具
arXivLabs:与社区合作者的实验项目
arXivLabs 是一个框架,允许合作者直接在我们的网站上开发和共享新的 arXiv 功能。
与 arXivLabs 合作的个人和组织都接受并接受了我们开放、社区、卓越和用户数据隐私的价值观。 arXiv 致力于这些价值观,并且只与遵守这些价值观的合作伙伴合作。
您有一个可以为 arXiv 社区增加价值的项目想法吗? Learn more about arXivLabs。