摘要:Workflow本质是开发者基于实际业务场景开发用于部署模型或应用的流水线工具。
Workflow(也称工作流,下文中均可使用工作流进行描述)本质是开发者基于实际业务场景开发用于部署模型或应用的流水线工具。在机器学习的场景中,流水线可能会覆盖数据标注、数据处理、模型开发/训练、模型评估、应用开发、应用评估等步骤。
区别于传统的机器学习模型构建,开发者可以使用Workflow开发生产流水线。基于MLOps的概念,Workflow会提供运行记录、监控、持续运行等功能。根据角色的分工与概念,产品上将工作流的开发和持续迭代分开。
了解Workflow的功能与构成后,可通过订阅workflow的方式尝试运行首条工作流,进一步了解Workflow的运行过程。
1、前往AI Gallery,在“资产集市>数据>数据集”下载常见生活垃圾图片。
2、下载方式选择“ModelArts数据集”,目标区域“华北-北京四”,数据类型选择“图片”,数据集输出位置为数据集的输出路径,数据集输入位置为数据集的输入路径,数据集名称可自行修改。
3、单击“确定”,自动跳转至AI Gallery的个人中心“我的下载”页签。等待下载完成即可。
1、订阅完成后,单击“运行”进入配置页面,资产版本默认,选择云服务区域“华北-北京四”,单击“导入”即可。
说明:
工作流运行的云服务区域需要与创建的数据集所在区域保持一致,否则工作流配置时无法选到准备好的数据集。
2、导入完成后会自动跳转至workflow的详情页面,在详情页单击右上方的“配置”按钮完成配置。配置参数填写参考表1。
1.配置完成后单击右上方“保存配置”按钮,保存完成后单击“启动”开始运行工作流。工作流在运行过程中,需要用户在数据标注节点以及服务部署节点完成相关操作或者配置。
(a)数据标注节点:标注节点启动后会等待用户确认数据标注是否完成,用户需单击“实例详情”前往数据集页面查看该数据集是否已完成标注。
(b)确认数据标注完成后返回执行页面,单击“继续运行”。
(c)服务部署节点:“选择模型模板”默认选择最新模型版本,“计算节点规格”选择GPU类型,“资源池”默认选择公共资源池,可单击开启“是否自动停止”,默认不开启。配置完成后单击“继续运行”即可,等待服务部署完成。
2.测试推理服务:工作流运行完成后,在服务部署节点右侧单击“实例详情”进行跳转或者在ModelArts管理控制台,选择“部署上线>在线服务”,找到部署的推理服务,单击服务名称,进入服务详情,单击“预测”。右边可查看预测结果。