超参数调整是机器学习管道的重要组成部分——最常见的实现使用网格搜索(随机或非随机)在一组组合之间进行选择。
本文将使用进化算法来找到优化我们定义的交叉验证指标的参数。本文可以有如下功能项:
- 使用多种进化算法进行超参数搜索
- 将功能记录到 Logbook 对象或与MLflow 内置集成。
- 利用绘图来了解优化过程。
注意:本文案例仅适用于分类,下一篇介绍回归。
数据集
作为演示数据集,我们将使用来自 Scikit-learn 的数字数据;这个想法是对 8x8 像素图像的手写数字进行分类。数据样本如下: