今天看到别人的文章,说到了随机森林可视化,于是尝试了下。
windows版本安装:
1.在下面去下载window的exe安装包,安装graphviz。
http://www.graphviz.org/download/
在路径选项,点击add path to computer,然后后面全部点确定就行。安装好以后,打开powershell,输入dot -version,就可以看到安装成功了。
2.安装pygraphviz和pybaobabdt
# 安装pygraphviz
conda install --channel conda-forge pygraphviz
# 安装pybaobabdt
pip install pybaobabdt
pybaobabdt.drawTree(decisionTreeClassifier, features=[], model=[], colormap='viridis', size=15, dpi=300, ratio=1, classes=[], maxdepth=-1, ax=-1)
sudo apt-get install graphviz graphviz-dev
vim ~/.bashrc
conda install --channel conda-forge pygraphviz
pip install pybaobabdt
主要是使用Pybaobabdt来绘制决策树。
下面这个是官网作者的图
这是我的数据的图:
不得不说,,,这个图也太丑了点,虽然用的是默认的决策树超参数。。。
DecisionTree( criterion=‘gini’, splitter=‘best’, max_depth=None, min_samples_split=2, min_samples_leaf=1, min_weight_fraction_leaf=0.0, max_features=None, random_state=None, max_leaf_nodes=None, min_impurity_decrease=0.0, class_weight=None, ccp_alpha=0.0)
max_depth = 10 | max_depth = 3 |
---|---|
我这个数据由于特征值太小,所以默认的决策树生长到5层就不生长了。所以max_depth参数只在1-5之间才有用。这加深了我对树类模型的调参认识。
from matplotlib.colors import ListedColormap
colors = ["gray", "purple"]
colormap = ListedColormap(colors)
pybaobabdt.drawTree(clf, size=10, dpi=72, features=features, colormap=colormap)
pybaobabdt.drawTree(decisionTreeClassifier, features=[], model=[], colormap='viridis', size=15, dpi=300, ratio=1, classes=[], maxdepth=-1, ax=-1)
这个ratio用来控制字符显示大小,maxdepth用来控制树的显示,可以选择只显示顶端5行。
随机森林可以选择只显示其中一棵树
clf = RandomForestClassifier(n_estimators=20).fit(data, label)
pybaobabdt.drawTree(clf.estimators_[0], size=10, dpi=300, features=features)