• stata17运行crtrees显示缺失值


    关注 码龄 粉丝数 原力等级 -- 被采纳 被点赞 采纳率 uiooo_ 2024-03-30 19:58 采纳率: 0% 浏览 2 首页/ 人工智能 / stata17运行crtrees显示缺失值 机器学习决策树 两行代码的差异仅仅体现在option上,为什么第一行代码会报错显示缺失值,而第二行不会? 展开全部 收起 写回答 好问题 0 提建议 追加酬金 关注问题 微信扫一扫 点击复制链接 分享 邀请回答 编辑 收藏 删除 结题 收藏 举报 追加酬金 (90%的用户在追加酬金后获得了解决方案) 当前问题酬金 ¥ 0 (可追加 ¥500) ¥ 15¥ 20¥ 50¥ 100¥ 200 支付方式 扫码支付 二维码出错 点击刷新 支付金额 15 元 提供问题酬金的用户不参与问题酬金结算和分配 支付即为同意 《付费问题酬金结算规则》 结题 再想想 删除 再等等

    2条回答 默认 最新

    • 专家-赤兔[在线] 全栈领域优质创作者 2024-03-30 19:59
      关注

      引自免费微信小程序:皆我百晓生

      在 stata 17 中,执行 crtrees 函数(适用于回归树)并查看缺失值时,可能会遇到两种情况:

      1. 第一行代码显示缺失值:这可能是因为第 option 参数没有被正确设置为 'tree',这通常是在命令行界面中使用的默认选项。在 Stata 中,如果你尝试通过命令行界面输入命令,且未将 option 参数设置为 'tree',那么 Stata 将尝试使用默认的回归树模型 (regression trees) 来计算特征和预测变量之间的关系。

      例如,假设你的命令如下:

      options option='tree'
      srtree price trunk weight length foreign gear_ratio, seed(12345)
      

      此时,如果 option 参数未设置为 'tree',Stata 将使用默认的回归树模型进行分析,并尝试推断参数值(例如,权重和长度)。然而,由于某些外生变量(例如外国齿轮比率)是连续值而不是离散值,因此 Stata 将无法直接用连续数据集中的观察值估计它们,而是需要通过计算离散嵌套特征(foreign gear_ratio)与连续观测值之间相关性来估计这些数值。

      为了解决这个问题,你需要确保将 option 参数设置为 'tree'。以下是如何进行操作的步骤:

      1. 在命令行界面中,转到 data 目录并切换到要分析的数据文件(price, trunk, weight, length, 和 foreign gear_ratio)。
      2. 删除 option 参数前面的逗号,以便将其设置为 'tree'。例如,如果你将 option 替换为 tree,你会看到修改后的命令:
      options option='tree', seed(12345)
      

      这样,Stata 就将会在解析数据时使用回归树模型,从而处理缺失值问题。

      1. 保存并关闭所有打开的 Stata 文件以确保更改生效。然后重新加载数据并应用这个调整后的选项。

      例如,在 Stata 中执行上述操作后,当你再次运行 srtree 命令,你应该能看到缺失值已经被忽略,表示回归树成功地估计了连续变量和嵌套特征之间的关系。如果你想绘制回归树的图形,可以使用 crtree 函数的标准输出,或者在数据文件本身或命令行界面中运行 plot srtree 命令。以下是一个示例代码片段,用于绘制回归树:

      plot srtree price trunk weight length foreign gear_ratio, seed(12345)
      

      这将在工作目录中创建一个基于以上数据的回归树图形,包含参数 option 的值以及各部分的解释。

      注意,代码以 code 格式提供,其中包含了必要的假设和调整选项(即 option='tree'),以及你所需的回归树图形绘制命令。实际使用时,你可能需要根据具体数据格式和目标图形类型(如线性回归、分类回归、决策树等)进行相应的调整。

      评论 编辑记录
    • Kwan的解忧杂货铺 Java领域优质创作者 2024-03-30 19:59
      关注

      晚上好🌙🌙🌙
      本答案参考ChatGPT-3.5

      第一个问题是为什么第一行代码会显示缺失值,而第二行不会。这是因为两行代码使用了不同的选项,导致生成的树模型不同。

      在第一行代码中,使用了默认选项,即没有指定选项。根据Stata的默认行为,默认情况下,如果节点分裂的变量包含缺失值,该节点将被分为两个子节点,其中一个子节点包含缺失值的观测值。因此,在第一行代码中,当生成树模型时,可能会出现某个特征包含缺失值的情况,并且这些缺失值将被用于生成子节点。

      而在第二行代码中,使用了reg选项,指定了在每个节点上应用线性回归模型。当使用reg选项时,如果某个特征包含缺失值,该节点将被视为无效节点,并且将被跳过。因此,在第二行代码中,如果某个特征包含缺失值,将不会使用该特征来生成子节点。

      为了解决第一行代码中显示缺失值的问题,可以尝试使用reg选项,或者通过删除包含缺失值的观测值来处理缺失值。

      解决方案:

      1. 修改第一行代码,添加reg选项,即将代码修改为crtrees price trunk weight length foreign gear_ratio, reg(seed(12345))
      2. 删除包含缺失值的观测值,在运行第一行代码之前,先进行数据清洗,删除包含缺失值的观测值。

      注意:根据你提供的信息,代码存在一些语法错误,在修改代码时请仔细检查语法错误并进行修复。

      评论 编辑记录
    编辑
    预览

    报告相同问题?

  • 相关阅读:
    第三章 调度系统架构设计之获取集群资源信息
    【k8s命令】查看node、pod使用的资源
    vue基础知识和原理(二)
    离线数仓(五)【数据仓库建模】
    像素间的关系
    吴恩达深度学习笔记——改善深层神经网络:超参数调整,正则化,最优化(Hyperparameter Tuning)
    RabbitMQ学习-第一部分
    RK3588平台开发系列讲解(USB篇)内核 USB 配置
    Kubernetes
    MVSNet CVPR-2018 学习总结笔记 译文 深度学习三维重建
  • 原文地址:https://ask.csdn.net/questions/8081550