
目标:将表格转化成一颗树
决策树的核心算法要解决两个问题:

流程:

分类树对应代码:


这两个参数用来控制随机性
![]()
控制不纯度的计算
max_depth 限制树的最大深度,超过深度减去
min_samples_leaf & min_samples_split

mind_ features&min_impurity_decrease

确定最优剪枝参数?
使用确定超参数曲线判断
结果显示 3最好
class_weight&min_weight_fraction_leaf (控制目标参数权重)

重要属性
属性就是在模型训练之后,能够调用查看模型的各种性质。

接口

回归树衡量分类指标有三:

观察模型稳定性的一种方法

网格搜索——同时调整多个参数的技术 (本质是枚举技术)
