• PySCENIC(二):pyscenic单细胞转录组转录因子分析


    我们继续完成pySCENIC的分析!本来想这一节可视化也讲了,但是不着急,我发现有些伙伴没搞明白原由,或者太会“衣来伸手饭来张口”,所以这里着重整理了需要下载的文件!!!

    上一节说了pySCENIC的分析环境配置及安装,除了这些,还有一些必要条件,例如相关文件的下载,一些数据转化等等。

    为了减轻大家的负担,文件我已经下载好了,包括人的、鼠的,以及转化文件的py脚本,已上传QQ群文件,群成员可在群里免费获取!

    假设你完成了上面的步骤,那接下来的分析至少在代码上很简单,三个步骤,可能会等待一段时间,尤其是第一、二步骤,不过相比于R简直是神速。注意:建议还是用服务器(别开玩笑用免费的2G内存的服务器😂),除非你的数据不大可用≥64G内存的本机。

    分析第一步:GRN---运行完得到sce.adj.csv文件

    1. pyscenic grn --num_workers 10 \
    2. --sparse \
    3. --method grnboost2 \
    4. --output sce.adj.csv \
    5. sce.loom \
    6. hs_hgnc_tfs.txt
    7. #这一步的目的
    8. #推断转录因子与提供的表达矩阵基因的共表达模块,基于grnboost2,R中时GENIE3

    参考基因组的情况根据实际情况自行下载,当然我下载的也可以用,具体深入的原理有兴趣的可以去了解,我只是参考文献使用的!数据库更新了,用之前的文件会出错!

    鼠的下载地址:

    Index of /cistarget/databases/mus_musculus/mm10/refseq_r80

    人的下载地址:

    Index of /cistarget/databases/homo_sapiens/hg38/refseq_r80
    分析第二步:RcisTarget---运行完得到sce.regulons.csv文件

    1. pyscenic ctx --num_workers 10 \
    2. --output sce.regulons.csv \
    3. --expression_mtx_fname sce.loom \
    4. --all_modules \
    5. --mask_dropouts \
    6. --mode "dask_multiprocessing" \
    7. --min_genes 10 \
    8. --annotations_fname motifs-v9-nr.hgnc-m0.001-o0.0.tbl \
    9. sce.adj.csv \
    10. hg38__refseq-r80__10kb_up_and_down_tss.mc9nr.genes_vs_motifs.rankings.feather
    11. #这一步的目的
    12. #进行TF-motif富集分析,识别直接靶标
    13. #得到转录因子(TF)与其对应的直接作用的靶点,称为regulon(每一个regulon是1个TF和其调控的靶基因)

    分析第三步:AUCell---运行完得到sce_SCENIC.loom文件,即分析结果

    1. pyscenic aucell --num_workers 3 \
    2. --output sce_SCENIC.loom \
    3. sce.loom \
    4. sce.regulons.csv
    5. #这一步的目的
    6. #使用AUCell对每个细胞的每个regulon活性进行评分。

    以上就是pyscenic的分析内容了!

    更多精彩内容请至我的公众号---KS科研分享与服务

  • 相关阅读:
    vue学习之基本用法
    Java中的mysql——面试题+答案(存储过程,外键,隔离级别,性能优化)——第23期
    gin路由相关方法
    【Mysql】第8篇--数据库元数据
    DTcloud 装饰器
    Docker笔记
    6. Redis 发布与订阅
    c语言练习92:链表的中间结点
    家庭生活开支如何记录,怎么记账一目了然
    CentorOS上安装elasticsearch7.17.3,不用docker方式
  • 原文地址:https://blog.csdn.net/qq_42090739/article/details/127745722