• [生物信息]临床研究统计分析成长营14天班


    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    线性相关分析,要求两个被分析的变量都是正态分布.
    在这里插入图片描述

    在这里插入图片描述
    在这里插入图片描述
    电视数量和身高之间,有相关关系,没有因果关系.

    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    多因素变量筛选方法 (P-value讲解)

    8 多因素回归分析中的变量筛选方法(P-value)
    在这里插入图片描述

    生存分析方法的正确表达

    12 生存资料结局统计分析
    在这里插入图片描述
    在这里插入图片描述
    生存资料:指的是要考虑时间的结局以及发生这种结局所经历的时间( event and time).
    在这里插入图片描述
    在这里插入图片描述

    在这里插入图片描述
    假设我们定义终点是因肝癌死亡,那么第一个患者死于肺癌并没有到达事件终点. 因此,这个死于肺癌的患者叫做结尾.他的生存时间是118天,但是它结尾了,而没有到事件终点.
    第二个患者,出现终点了,生存时间90天.
    第三个患者,研究终止时,没有出现终点,所有结尾了.
    第四个患者,失去访问患者,也没有出现终点,结尾了.
    第六位,出现终点了.
    因此,只有两位患者出现终点,在我们传统意义上的生存分析里面,出现我们定义的终点,就叫做完全数据,如果没有出现我们定义的终点,就叫做截尾.
    在这里插入图片描述本质上就是有没有出现我们(研究者)定义的终点!!
    在这里插入图片描述
    在这里插入图片描述
    time to event. 关于生存资料到底是什么分布,其实是未知的,你假定是什么分布,他就是什么分布,
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    时段分的越小越精确. 也就是随访时间越短越精确.误差越小.
    在这里插入图片描述

    生存曲线

    在这里插入图片描述
    横坐标一般是时间,纵坐标一般是累积生存概率.如果纵坐标是生存率,那么我们的生存曲线一定是单调递减的. 因为随着生存时间的延长,这个生存率肯定是越来越低的,比如说我们现在有100个人,100年后,肯定都去世了.生存率是0%.
    但是如果纵坐标是病死率,那么应该是单调递增的生存曲线在这里插入图片描述
    在这里插入图片描述
    为什么左边的生存曲线比右边的生存曲线多了好多平台呢,像多了一些阶梯一样? 因为左边这个生存曲线的样本量比较少,不是在所有的时间点上都有人出现终点.

    样本量小,发生终点时间的样本量就低.从而导致了很多平台期,主要是样本量的问题,当你的样本量不断增加,它几乎在所有的时间点都有人出现终点,那它自然就是一条平滑的曲线.

    生存分析的主要任务

    在这里插入图片描述

    在这里插入图片描述
    总之,会生存分析三板斧即可: k-m法 、log-rank检验、cox回归.
    在这里插入图片描述
    随访起点是我们自己定义的,
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    中位生存时间:是有一半的人出现死亡的时间.
    中位复发时间:就是有一半的人复发的时间.
    (上面两个中位时间不是中位数的概念,而是半数的概念,例如半数致死剂量=药物最大毒性剂量)
    当然了,如果你随访的样本比较好,在你随访的时间内,没有死亡一半的人数. 那就没有中位XXX时间.
    中位随访时间,所有人随访的时间从小到大排列,处在中间位置的随访时间就是中位随访时间.它反映了我们随访时间的长短. 这是一个中位数的概念.

    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述如果引出的0.5死亡率的水平线恰好和生存曲线的平台相交,那取平台前还是平台后呢?在这里插入图片描述
    软件会使用线性内插法精确的算出来,我们不用操心.
    我们找前后两个拐点的位置,去解一个方程就可以了,t是我们的中位生成时间,到底是多少不知道,但是它前一个时间点两年的和后一个时间点三年的生存率是有拐点的. 两年的生存率是55.62%,三年的生存率是41.98%,这样我就可以解方程了.

    在这里插入图片描述
    最好的情况是,所有人都出现终点. 其次就是,至少达到中位生存时间, 再次至少有1/3的样本达到终点.
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    传统的生存分析只有两种可能性的状态 ,要么仍然存活,要么结尾,没有第三种情况,
    在这里插入图片描述
    在这里插入图片描述

    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    分组绘制
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    SPSS中指定0是死亡,其他非零的都是结尾.
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

  • 相关阅读:
    国产软件Bigemap与国产在线地图源<星图地球数据云>推动国内新GIS应用
    汇编语言与微机原理 期末复习题整理(小题)
    Bug:.tar文件解压后提示“不可信的旧时间戳”解决方案
    【JavaScript面试题】bind和call、apply有什么作用?它们的区别是什么?
    支持YUV和RGB格式两路视频同时播放
    C++基础学习笔记-类与对象
    PyQt5快速开发与实战 10.1 获取城市天气预报
    树的基本概念
    微信小程序:炫酷恶趣制作神器小程序源码
    5.Vectors Transformation Rules
  • 原文地址:https://blog.csdn.net/adreammaker/article/details/126175980