码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 【机器学习】决策树为什么对缺失值不敏感,如何处理缺失值?


    决策树处理缺失要考虑以下三个问题:

    1、当开始选择哪个属性来划分数据集时,样本在某几个属性上有缺失怎么处理:

    (1)忽略缺失样本。
    (2)填充缺失值
    (3)计算信息增益率时根据缺失率的大小对信息增益率进行打折,例如计算属性A的信息增益率,若属性 A的缺失率为0.9,则将信息增益率乘以0.9作为最终的信息增益率。

    2、一个属性已经被选择,那么在决定分割点时,有些样本在这个属性上有缺失怎么处理?

    (1)忽略这些缺失的样本。
    (2)填充缺失值,例如填充一个均值或者用其他方法将缺失值补全。 把缺失的样本,按照无缺失的样本被划分的子集样本个数的相对比率,分配到各个子集上去,至于那 些缺失样本分到子集1,哪些样本分配到子集2,这个没有一定准则,可以随机而动。
    (3)把缺失的样本分配给所有的子集,也就是每个子集都有缺失的样本。
    (4)单独将缺失的样本归为一个分支。

    3、决策树模型构建好后,测试集上的某些属性是缺失的,这些属性该怎么处理?
    (1)如果有单独的缺失值分支,依据此分支。
    (2)把待分类的样本的属性A分配一个最常出现的值,然后进行分支预测。
    (3)待分类的样本在到达属性A结点时就终止分类,然后根据此时A结点所覆盖的叶子节点类别状况为其 分配一个发生概率最高的类。

  • 相关阅读:
    【算法篇-动态规划】手撕各大背包问题 —— 01背包
    (附源码)计算机毕业设计SSM基于的景区旅游系统
    【2022】【论文笔记】太赫兹量子阱探测——
    [附源码]计算机毕业设计JAVA 图书管理系统
    【ECMAScript6】其它新增接口特性
    Python开发利器之VS Code
    程序员转业指南 - 当文员
    【最短路算法】dijkstra,SPFA和folyd
    leetcodeTop100(32) 合并链表数组
    [附源码]JAVA毕业设计框架的企业机械设备智能管理系统的设计与实现(系统+LW)
  • 原文地址:https://blog.csdn.net/weixin_43935696/article/details/126317571
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号