• Multi-series Time-aware Sequence Partitioning for Disease Progression Modeling


    电子医疗保健记录(EHRs)是患者数据的全面纵向收集,在疾病进展建模以促进临床决策方面发挥着关键作用。基于ehr,在这项工作中,我们关注败血症——一种可以从几乎所有类型的感染(如流感、肺炎)发展而来的广泛综合征。败血症的症状,如心率升高、发烧和呼吸短促,对其他疾病来说是模糊的和常见的,这使得对其进展的建模极具挑战性。受最近一种新的子序列聚类方法的成功启发:Toeplitz逆协方差聚类(TICC),本文将脓毒症进展建模为一个子序列划分问题,并提出一种多序列时间感知的TICC (MT-TICC),其中包含了ers的多序列性质和不规则时间间隔。MT-TICC的有效性首先通过使用具有真实标签的真实手势数据集的案例研究进行了验证。然后,我们进一步将其应用于使用ehr进行脓毒症进展建模。结果表明,MT-TICC可以显著优于包括TICC在内的其他基准模型。更重要的是,它揭示了可解释的模式,有助于更好地理解败血症的进展。

    问题

    TICC利用逆协方差矩阵,并约束这些矩阵为逐块托普里茨,对每个聚类中的时不变结构模式进行建模。 

    尽管TICC取得了巨大的成功,但将其应用于ehr时仍存在两个主要挑战:1)TICC采用单个时间序列作为输入,而大多数ehr由多个序列组成,作为不同患者访问的集合。将TICC单独应用于每个访问可能会导致不同访问之间的模式不一致,而将所有访问合并为一个序列可能会在相邻访问之间的连接处引入一些不希望出现的模式。本文通过考虑多序列输入对TICC进行扩展,将其称为多序列TICC (M-TICC);2) ehr中记录的收集时间间隔一般不规律,从秒到天不等。例如,在我们的ehr中,两个连续记录之间的间隔范围为0.94秒到28.19小时。因此,有必要考虑不规则的时间间隔来捕获目标疾病的潜在进展模式[Baytas等。2017]。然而,TICC忽略间隔,鼓励将连续的记录分配到同一簇中。因此,进一步扩展了M-TICC,引入了对连续记录之间一致性的时间感知,称为多序列,时间感知TICC (Multi-series, Time-aware TICC, MT-TICC)。

    就是多元时间序列的子序列聚类方法 即为TICC

     

     

     具体来说,间隔较短的两个事件比间隔较长的事件更有可能属于同一个集群。因此,在一致性项中必须考虑时间间隔的不规则性。

     优化方法:It can be solved by an alternating direction method of multipliers (ADMM) 

  • 相关阅读:
    一线互联网大厂普遍使用的Docker,掌握这套面试题,让领导主动涨薪
    一篇文章彻底理解数据库的各种超时参数
    一文搞清楚Java中的包、类、接口
    Nginx+keepalived实现七层的负载均衡
    Windows版 PostgreSQL 利用 pg_upgrade 进行大版升级操作
    k3s 快速入门 - 集群搭建
    如何选择独立站ERP系统?
    Google Earth Engine ——快速实现MODIS影像NDVI动画的在线加载并导出
    常用免费api推荐,提升开发效率
    [极客大挑战 2019]FinalSQL
  • 原文地址:https://blog.csdn.net/zj_18706809267/article/details/126212582