• SAS学习8、9(方差分析、anova过程、相关分析和回归分析、corr过程、reg过程、多元线性回归、stepwise)


    方差分析(anova过程)

    做方差分析前提是假设每一个随机变量是符合正态分布的,且方差是一样的
    在这里插入图片描述

    可以两两构造t检验进行分析
    在这里插入图片描述

    anova过程是交互式过程,需要quit退出
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    可以看到下面分成了两组
    在这里插入图片描述

    单因素方差分析

    R书415页
    在这里插入图片描述

    双因素方差分析

    董书264,数学概念在R书435页

    不考虑两个变量的交互作用,即相互影响
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    相关分析与回归分析

    找出变量之间的相互关系
    相关分析是发现关联关系,回归分析是写出关系式
    在这里插入图片描述
    在这里插入图片描述

    corr过程

    nomiss 忽略有缺失值的观测行
    nosimple 会影响输出结果
    在这里插入图片描述

    在这里插入图片描述

    如果nosimple的话,不会输出上面的两行
    0.0022 是假设检验算出来的结果,说明拒绝原假设,即两个变量相关
    在这里插入图片描述

    一元线性回归分析

    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    reg过程

    在这里插入图片描述
    在这里插入图片描述

    先做相关分析
    model y=x,左边是因变量,右边是自变量
    在这里插入图片描述

    在这里插入图片描述

    -17.35是截距,0.22是斜率
    其他东西都是对这个回归做检验,检验其是否合理;比如样本值本身不是正态分布;回归是否是线性的;变量之间是否有关系

    可以在中间三行看到,F检验,pr值很小,那么说明模型相当好,具有明显的统计学意义
    R-Square,相关系数平方,除以n-1
    Adj R-Sq 调整过的相关系数平方,除以的是n-2,两个都比较大,说明相关性高

    在对系数进行检验时,看到对斜率进行t检验,pr值很小,拒绝斜率为0的假设
    但是看到截距的t检验,pr值很大,要接受截距=0的假设;说明这里截距计算有问题,需要调整
    在这里插入图片描述

    调整就是鼠标那行,加了个noint,也就是no intercept,没有截距
    在这里插入图片描述

    在这里插入图片描述

    其中的一些概念
    在这里插入图片描述

    在这里插入图片描述

    多元线性回归

    在这里插入图片描述

    在这里插入图片描述

    有两个变量的检验情况不太好,分别是weight和rstpulse
    说明可能关系不大,需要剔除
    在这里插入图片描述

    在这里插入图片描述

    向前引入法是局部最优解
    在这里插入图片描述
    在这里插入图片描述

    在这里插入图片描述

    相关系数平法的大小阈值和统计变量的多少有关
    第一步,只有一个变量
    在这里插入图片描述

    第二步,加了个年龄,相关系数平方增大,cp减小,模型变好了
    第三步加了rumpulse,更好了
    第四步加了maxpulse,更好了
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

  • 相关阅读:
    SpringBoot进阶-日志等级配置与操作
    输入输出、文件读写、数据类型
    数组中的第K个最大元素 -- 堆&快排
    xilinx Mailbox 中的ipi message地址计算方式
    计算机网络-传输层
    仅做笔记用:Stable Diffusion 通过 ControlNet 扩展图片 / 扩图
    ​怎么安全无损地将操作系统转移到固态硬盘?
    Javaweb之Vue的概述
    【微信小程序】uni-app 配置网络请求
    matlab神经网络求解最优化,matlab神经网络应用设计
  • 原文地址:https://blog.csdn.net/windyjcy/article/details/127725707