• stata手动绘制logistic回归预测模型校准曲线(Calibration curve)校准曲线(1)


    校准曲线图表示的是预测值和实际值的差距,作为预测模型的重要部分,目前很多函数能绘制校准曲线。
    一般分为两种,一种是通过Hosmer-Lemeshow检验,把P值分为10等分,求出每等分的预测值和实际值的差距
    在这里插入图片描述
    在这里插入图片描述
    既往我们已经介绍了使用R语言手动绘制logistic回归预测模型校准曲线(Calibration curve),今天我们来演示stata手动绘制logistic回归预测模型校准曲线(Calibration curve)校准曲线,手动绘制的好处在于加深你对绘图的理解,而且能个性化的进一步处理图形。第一种绘图本质就是我们的折线图,既往我们已经介绍了怎么使用stata绘制折线图,只要求出相关数据就可以了。
    我们先导入数据,继续使用我们的早产数据
    在这里插入图片描述
    这是一个关于早产低体重儿的数据(公众号回复:早产数据,可以获得该数据),低于2500g被认为是低体重儿。数据解释如下:low 是否是小于2500g早产低体重儿,age 母亲的年龄,lwt 末次月经体重,race 种族,smoke 孕期抽烟,ptl 早产史(计数),ht 有高血压病史,ui 子宫过敏,ftv 早孕时看医生的次数,bwt 新生儿体重数值。
    我们先把字符转成数字变量

    g race1 =1
    replace race1 =2 if race =="black"
    replace race1 =3 if race =="other"
    g smoke1 =1
    replace smoke1 =0 if smoke =="nonsmoker"
    
    • 1
    • 2
    • 3
    • 4
    • 5

    转换好以后就可以建立模型了,怎么建立logistic回归模型,请看我既往的stata文章,这里就直接上代码了

    logistic low age i.race1 i.smoke1 lwt ptl i.ht i.ui ftv
    
    • 1

    在这里插入图片描述
    生成预测概率

    predict pr,pr
    
    • 1

    在这里插入图片描述
    先对pr进行排序

    sort pr
    
    • 1

    排序后把pr分成10个等分组

    egen group=cut( pr ), group(10)
    
    • 1

    在这里插入图片描述
    算出每个等分组的pr平均值

    egen meanpr=mean( pr ),by(group)
    
    • 1

    在这里插入图片描述
    继续算出每个等分组的low值

    egen meany=mean( low ),by(group)
    
    • 1

    然后绘图就可以了

    scatter meanpr meany
    
    • 1

    在这里插入图片描述
    还可以做进一步修改,下回继续聊。

  • 相关阅读:
    python基础
    什么是单文件组件?
    找到实现虚实结合的正确的方式和方法,并且让区块链的功能和作用得到最大地发挥
    电脑重装系统后内存占用高怎么解决?
    【Linux】Linux文本处理-grep、awk、sed
    FPGA入门总结知识点
    mac虚拟机搭建&设置静态ip
    网页乱码问题及其HTML编程解决方案
    RabbitMQ学习总结-延迟消息
    前端架构师之09_JavaScript_BOM
  • 原文地址:https://blog.csdn.net/dege857/article/details/127381945