• 晚期非小细胞肺癌肿瘤异质性和微环境的单细胞分析(Nature Communication, 2021年5月5日)


    晚期非小细胞肺癌肿瘤异质性和微环境的单细胞分析(Nature Communication, 2021年5月5日)

    Single-cell profiling of tumor heterogeneity and the microenvironment in advanced non-small cell lung cancer

    我觉得的 Highlight

    • 42例肺癌晚期(III/IV)组织活检采样样本

    • 主要研究肿瘤内异质性以及对应的免疫微环境

    • 肺腺癌(LUAD)marker : NAPSA, TTF-1 (NKX2-1)

    • 肺鳞癌(LUSC)marker : TP63, CK5 (KRT5) (虽然感觉这 marker 有点不是很靠谱)image-20220815161731399

    • 肺鳞癌和肺腺癌间异质性稍大于癌内异质性image-20220815162004239

    • 肺泡 1 型细胞marker : CAV1、AGER

    • 肺泡 2 型细胞marker : CLDN18、SFTPA1、SFTPC

    • 在走标准流程的时候没有筛选 2000 个可变基因,相反使用的是 600个。

      我觉得这个思路是非常值得借鉴的(因为我自己的分析经常也不用 2000)。

      这里我给出我自己的理由(没有理论支持,纯属感觉):

      • 因为每套数据平均的基因个数都不一样,每种类型的细胞表达的基因种类也不同。因此无论是总体的统一分析还是后续的更细致的分群注释,无脑的使用 2000 个基因总感觉有那么一点问题。就比如这篇文章 We obtained 1673 genes and 5238 UMIs per cell on average. 平均下来一个细胞也就 1600 个基因而已,如果使用 2000 那么绝大部分的基因的稀疏性仍然很强,这时候就可以适当的调整基因个数(800-1200,即50%-80%)。不过文章选择 600 可能太少了,我觉得这个值在以后的分析中是需要重点的调试对象。

    我觉得有用的 Introduction

    • KRAS G12C 抑制剂在肺癌中有效,但是在胰腺癌中有效率很低,导致这个主要原因可能是因为肿瘤相关的成纤维细胞组成不同**(Cancer Discov, 2020)** 1

    我感兴趣的 Result

    42 名患者共包括 90406 个细胞,其中癌细胞 56121 个,占比 >62%(这个数据量讲实话有点多的离谱),平均下来一个样本大概 2150 个细胞,癌细胞就占了 1336 个。质控和过滤的参数没什么特殊的,就是使用线粒体 30%的阈值是不是有点太宽了。这篇文章有意思的点在于竟然是直接使用基因 marker 直接定义出正常上皮细胞和癌细胞的:

    • Epithelial cells (CAPS+, SNTN+, EPCAM-)
    • Cancer cells (CAPS-, SNTN-, EPCAM+)

    实际上正常细胞就占比不到 1300 个,就占比不到 1.5%。感觉根本就没有必要强行的操作。

    image-20220815162722592

    然后作者对每一个患者计算了肿瘤内异质性,这个指标一共分为 CNV 异质性和转录本 EXP 异质性。两种异质计算方法完全一样,就是计算每一个患者的所有肿瘤细胞两两之间的相关性(文章使用的是皮尔森相关系数),然后每一个患者计算 IQR。但是这里有一个问题,你既然选择了皮尔森相关系数为啥不使用 3σ距离呢要用 IQR,或者你都选了 IQR 前面选择 wilcox不是更加符合单细胞的分布吗?虽然这个结果可能大差不差的。但是看上去总是让人摸不着头脑。

    一个重要的结论就是,染色体的异质性与转录组的异质性强相关

    这个从生物学逻辑上也挺好理解的,因为染色体出现异常。导致在翻译和转录的过程中,出现多种多样的转录本。我将其称为转录本多样性,当然转录本的多样性是否能变成蛋白质组多样性就不清楚了。

    image-20220815164852449

    然后作者进一步的分析发现鳞癌的基因组异质性是稍大于腺癌的,但是在转录组异质性水平没有发生明显的变化。但是这位来自同济大学医学院附属上海肺病医院肿瘤内科,叫Fengying Wu的大哥你这个图是不是标错了

    image-20220815165403798

    作者对这个发现进行了解释——具有驱动突变的患者可能会受到基因组改变以外的表型影响。

    但是我个人对这个解读并不是很满意,这里这个现象出现的话应该是有 2 个原因,一个是计算相关的原因,一个是生物学原因。

    • 第一个原因就是你本身计算的方法有问题,在计算基因组异质性的时候,因为数据用的是 inferCNV出来的数据所以使用皮尔森相关系数没什么大问题。但是计算转录组异质性的时候应该得用 Wilcox 相关的。
    • 第二个(和作者的解释大差不差进行了补充),譬如 2022 年 CancerCell 2 上的一篇文章就描述了转录本和基因组变异模式并没有很大的关联。还有,就是很有可能染色体或基因组的变异区域在非编码区,这时候就会导致转录本转录异常,使得转录本的多样性增加,并且异常的转录本会直接影响到下游的调控通路,使得出现某些患者虽然不带有驱动突变,但是却有与驱动突变相似的生物学行为,譬如在 2018 年 Cell Report3就阐述了一种虽然基因组不发生变异但是转录本发生异常从而导致患者具有与基因组异常相同生物学行为的 hidden responders,而这种由于转录本多样性导致的通路活动改变也被称为aberrant pathway activity。

    然后就是中规中矩的分析流程了

    结语

    这篇文章是比较早的 focus 在肿瘤细胞的文章,讲实话确实下了一番功夫,但是确实肿瘤细胞不像免疫细胞,不仅存在肿瘤内异质性,也存在肿瘤间异质性。这种异质性会导致数据分析极为困难,并且现在也没有对应的工具(主要是我的文章还没发,不然就有工具可以用)能够进行深入的分析。还有就是如果有认识作者的人或者作者本人能看到这篇文章的话,得写一封信给编辑改一下图注。

    其他细节内容我就没怎么看

    Reference

    [1] Cancer Discov, 2020 https://doi.org/10.1158/2159-8290.CD-19-0644
    [2] Cancer Discov, 2020 https://doi.org/10.1016/j.ccell.2020.06.012
    [3] Cancer Report, 2018 https://doi.org/10.1016/j.celrep.2018.03.046
  • 相关阅读:
    Chrome修改主题颜色
    C语言经典例题-11
    ubuntu系统下mysql重置密码和修改密码操作
    codeforces每日5题(均1700)-第二天
    互联网公司研发效能/工程效率团队建设和规划
    1688API接入说明(商品详情数据示例)
    信息检索与数据挖掘 | 【实验】排名检索模型
    gitlab的安装与迁移
    Linux系统命令——用户及用户组管理命令
    docker内部无法使用ping等网络工具解决方案
  • 原文地址:https://blog.csdn.net/qq_40966210/article/details/126351231