对附件数据中未知类别玻璃文物的化学成分进行分析,鉴别其所属 类型,并对分类结果的敏感性进行分析。
需要我们对附件表单 3 中未知玻璃文物的化学成分的数据进行分析,并预测 其所属的类型,并进行敏感性分析。
第一步分析:根据表单二中的数据建立决策树模型,选择最佳的特征分类方 法,利用建立的决策树模型对表单 3 中的数据进行分类,并分析模型的合理性。
第二步分析:根据上一步建立的模型,我们观察不同分类器个数对模型评分 结果的影响,并给出模型的稳定性结论。
问题三需要我们对表单 3 中未知玻璃文物的化学成分进行分析,并预测其所 属的类型,并进行敏感性分析。 我们结合表 1 和 2,建立一个以玻璃种类划分的决策树。
利用以上建立的决 策树首先对表 3 的数据进行一级划分,划分为两种玻璃。再利用问题二的聚类重 心对表 3 继续进行亚类划分。 我们的决策树是基于信息增益的算法,算法的步骤如下所示:
我们根据表 1 和表 2 建立的决策树为:
由此可知,选择的划分特征为氧化铅的含量,如果氧化铅的含量低于 5.46, 则分为高钾玻璃,否则分为铅钡玻璃,模型的准确率为 100%,说明分类结果比 较合理。
接下来,我们利用训练好的决策树模型,结合问题二中的聚类中心,对表单 3 中的数据进行分类,分类结果如下:
在此基础上对数据进行扰动处理,将变量值在范围(-110%,+110%)内进 行随机缩放,观察结果与未进行扰动时结果的对比情况,进行灵敏性分析,结果 如下表所示:
最终得出扰动后,模型的准确率为 100%,说明了模型具有良好的稳定性, 比较合理,可以应用于分类中。