Machine learning operations (MLOps)
作为一个新兴领域,MLOps 在数据科学家、机器学习工程师和人工智能爱好者中迅速崛起。MLOps 代表机器学习操作。MLOps 是机器学习工程的核心功能,专注于简化将机器学习模型投入生产、然后维护和监控的过程。MLOps 是一种协作功能,通常由数据科学家、devops 工程师和 IT 人员组成。
MLOps 是一种用于创建机器学习和人工智能解决方案并提高其质量的有用方法。通过采用 MLOps 方法,数据科学家和机器学习工程师可以通过实施持续集成和部署 (CI/CD) 实践以及对 ML 模型的适当监控、验证和治理来协作并加快模型开发和生产的速度。
产品化机器学习很困难。机器学习生命周期由许多复杂的组件组成,例如数据摄取、数据准备、模型训练、模型调整、模型部署、模型监控、可解释性等等。它还需要跨团队的协作和交接,从数据工程到数据科学再到机器学习工程。当然,需要严格的操作严谨性才能保持所有这些流程同步并协同工作。MLOps 涵盖机器学习生命周期的实验、迭代和持续改进。
拿使用汽车工厂进行类比,它非常成立:MLOps 是您为扩展分析而构建的工厂。有一些大的概念。
第一步是将您在研发和试点方面的部分支出转移到建设基础设施上,以便您能够大规模生产和扩展您的人工智能项目。您还需要监控模型正在使用的数据(以汽车为例,油表或仪表板),以便您可以跟踪进出模型的数据的质量及其性能水平。
所以如果你从头开始建造每辆车,一直到门把手,那么你将花费大量的时间和精力做重复的老董。
MLOps 的主要优点是效率、可扩展性和降低风险。效率:MLOps 使数据团队能够实现更快的模型开发、交付更高质量的 ML 模型以及更快的部署和生产。可扩展性:MLOps 还支持巨大的可扩展性和管理,可以监督、控制、管理和监控数千个模型,以实现持续集成、持续交付和持续部署。具体来说,MLOps 提供了 ML 管道的可重复性,从而实现数据团队之间更紧密耦合的协作,减少与 DevOps 和 IT 的冲突,并加快发布速度。降低风险:机器学习模型通常需要监管审查和偏差检查。
机器学习项目中 MLOps 的跨度可以根据项目需求而集中或广泛。在某些情况下,MLOps 可以涵盖从数据管道到模型生产的所有内容,而其他项目可能只需要 MLOps 实现模型部署过程。大多数企业在以下方面部署 MLOps 原则:
探索性数据分析 (EDA)
数据准备和特征工程
模型训练和调优
模型审查和治理
模型推理和服务
模型监控
自动模型再训练
MLOps 的最佳实践可以通过应用 MLOps 原则的阶段来描述。
MLOps 是一组特定于机器学习项目的工程实践,借鉴了软件工程中更广泛采用的 DevOps 原则。DevOps 带来了一种快速、持续迭代的方法来交付应用程序,而 MLOps 则借鉴了相同的原则将机器学习模型投入生产。在这两种情况下,结果都是更高的软件质量、更快的修补和发布以及更高的客户满意度。
虽然 MLOps 的许多概念仍然适用,但在训练Dolly等大型语言模型时还需要考虑其他因素。让我们看一下 LLM 培训可能与传统 MLOps 方法不同的一些关键点:
MLOps 平台为数据科学家和软件工程师提供了一个协作环境,可促进迭代数据探索、用于实验跟踪、特征工程和模型管理的实时协同工作功能,以及受控模型转换、部署和监控。MLOps 可自动执行机器学习生命周期的操作和同步方面。