PySCENIC（二）：pyscenic单细胞转录组转录因子分析

我们继续完成pySCENIC的分析！本来想这一节可视化也讲了，但是不着急，我发现有些伙伴没搞明白原由，或者太会“衣来伸手饭来张口”，所以这里着重整理了需要下载的文件！！！

上一节说了pySCENIC的分析环境配置及安装，除了这些，还有一些必要条件，例如相关文件的下载，一些数据转化等等。

为了减轻大家的负担，文件我已经下载好了，包括人的、鼠的，以及转化文件的py脚本，已上传QQ群文件，群成员可在群里免费获取！

假设你完成了上面的步骤，那接下来的分析至少在代码上很简单，三个步骤，可能会等待一段时间，尤其是第一、二步骤，不过相比于R简直是神速。注意：建议还是用服务器（别开玩笑用免费的2G内存的服务器😂），除非你的数据不大可用≥64G内存的本机。

分析第一步：GRN---运行完得到sce.adj.csv文件


pyscenic grn --num_workers 10 \
  --sparse \
  --method grnboost2 \
  --output sce.adj.csv \
  sce.loom \
  hs_hgnc_tfs.txt
  #这一步的目的
  #推断转录因子与提供的表达矩阵基因的共表达模块，基于grnboost2，R中时GENIE3

参考基因组的情况根据实际情况自行下载，当然我下载的也可以用，具体深入的原理有兴趣的可以去了解，我只是参考文献使用的！数据库更新了，用之前的文件会出错！

鼠的下载地址：

Index of /cistarget/databases/mus_musculus/mm10/refseq_r80

人的下载地址：

Index of /cistarget/databases/homo_sapiens/hg38/refseq_r80
分析第二步：RcisTarget---运行完得到sce.regulons.csv文件


pyscenic ctx --num_workers 10 \
  --output sce.regulons.csv \
  --expression_mtx_fname sce.loom \
  --all_modules \
  --mask_dropouts \
  --mode "dask_multiprocessing" \
  --min_genes 10 \
  --annotations_fname motifs-v9-nr.hgnc-m0.001-o0.0.tbl \
  sce.adj.csv \
  hg38__refseq-r80__10kb_up_and_down_tss.mc9nr.genes_vs_motifs.rankings.feather
  #这一步的目的
  #进行TF-motif富集分析，识别直接靶标
  #得到转录因子(TF)与其对应的直接作用的靶点,称为regulon(每一个regulon是1个TF和其调控的靶基因)

分析第三步：AUCell---运行完得到sce_SCENIC.loom文件，即分析结果


pyscenic aucell --num_workers 3 \
  --output sce_SCENIC.loom \
  sce.loom \
  sce.regulons.csv
  #这一步的目的
  #使用AUCell对每个细胞的每个regulon活性进行评分。

以上就是pyscenic的分析内容了!

更多精彩内容请至我的公众号---KS科研分享与服务

相关阅读:
vue学习之基本用法
Java中的mysql——面试题+答案（存储过程，外键，隔离级别，性能优化）——第23期
gin路由相关方法
【Mysql】第8篇--数据库元数据
DTcloud 装饰器
Docker笔记
6. Redis 发布与订阅
c语言练习92：链表的中间结点
家庭生活开支如何记录，怎么记账一目了然
CentorOS上安装elasticsearch7.17.3，不用docker方式

原文地址：https://blog.csdn.net/qq_42090739/article/details/127745722