• 决策树算法


    决策树算法

    1.1 题目的主要研究内容

    熟悉和掌握决策树的分类原理、实质和过程,掌握决策树典型算法(ID3、C4.5、CART)的核心思想和实现过程。

    由于,我在本组的任务是对决策树算法的综述并且制作PPT,本次报告主要简述是决策树算法综述。

    (1)决策树算法是一种逼近离散函数值的方法。它是一种典型的分类方法,首先对数据进行处理,利用归纳算法生成可读的规则和决策树,然后使用决策对新数据进行分析。本质上决策树是通过一系列规则对数据进行分类的过程。决策树算法的优点有分类精度高;生成的模式简单;对噪声数据有很好的健壮性。因而是目前应用最为广泛的归纳推理算法之一,在数据挖掘中受到研究者的广泛关注。

    决策树的基本思想是来发现数据中蕴涵的分类规则。如何构造精度高、规模小的决策树是决策树算法的核心内容。决策树构造可以分两步进行。第一步,决策树的生成:由训练样本集生成决策树的过程。一般情况下,训练样本数据集是根据实际需要有历史的、有一定综合程度的,用于数据分析处理的数据集。第二步,决策树的剪技:决策树的剪枝是对上一阶段生成的决策树进行检验、校正和修下的过程,主要是用新的样本数扼集(称为测试数据集)中的数据校验决策树生成过程中产生的初步规则。

    决策树构造的构造方法输入是一组带有类别标记的例子,构造的结果是一棵二叉树或多叉树。二叉树的内部节点(非叶子节点)一般表示为一个逻辑判断,如形式为a=j的逻辑判断,其中a是属性,aj是该属性的所有取值:树的边是逻辑判断的分支结果。多叉树(ID3)的内部结点是属性,边是该属性的所有取值,有几个属性值就有几条边。树的叶子节点都是类别标记。

    由于数据表示不当、有噪声或者由于决策树生成时产生重复的子树等原因,都会造成产生的决策树过大。因此,简化决策树是一个不可缺少的环节。寻找一棵最优决策树,主要应解决以下3个最优化问题:①生成最少数目的叶子节点;②生成的每个叶子节点的深度最小;③生成的决策树叶子节点最少且每个叶子节点的深度最小。

    决策树的典型算法:有ID3、C4.5、CART等。

    (2)ID3算法是决策树的一种,它是基于奥卡姆剃刀原理的,即用尽量用较少的东西做更多

  • 相关阅读:
    SQL注入漏洞 | iwebsec
    C++异常
    软件测试 | 怎么写测试用例?设计测试用例的思路和方法......
    7-9 HashSet 重写相应方法
    C#面:ASP.NET Core项目如何设置IP地址和端口号
    一张图系列 - “position_embedding”
    透明多级分流系统(架构扫盲贴)
    中国速溶脱脂奶粉市场竞争态势与消费需求预测报告2022-2028年
    知识经济时代的基石:知识协同
    Flink之Watermark水印、水位线
  • 原文地址:https://blog.csdn.net/weixin_41984456/article/details/127571760