码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • Seurat | 完美整合单细胞测序数据(部分交集数据的整合)(一)


    1写在前面

    之前我们介绍了Seurat、Harmony,rliger三个包,用于3'和5'数据合并的方法。🤒
    但有时候我们会遇到两个datasets只有部分重叠,这和之前介绍的方法就有一点不同了。🤨

    2用到的包

    rm(list = ls())
    library(Seurat)
    library(SeuratDisk)
    library(SeuratWrappers)
    library(patchwork)
    library(harmony)
    library(rliger)
    library(RColorBrewer)
    library(tidyverse)
    library(reshape2)
    library(ggsci)
    library(ggstatsplot)
    • 1

    3示例数据

    这里我们提供1个3’ PBMC dataset和1个whole blood dataset。😉

    umi_gz <- gzfile("./GSE149938_umi_matrix.csv.gz",'rt')  
    umi <- read.csv(umi_gz,check.names = F,quote = "")

    matrix_3p <- Read10X_h5("./3p_pbmc10k_filt.h5",use.names = T)
    • 1

    创建Seurat对象。🧐

    srat_wb <- CreateSeuratObject(t(umi),project = "whole_blood")
    srat_3p <- CreateSeuratObject(matrix_3p,project = "pbmc10k_3p")
    rm(umi_gz)
    rm(umi)
    rm(matrix_3p)
    srat_wb
    srat_3p
    • 1
    alt

    alt

    4修改metadata

    为了方便后续分析,这里我们对metadata进行一下注释修改。 😁

    colnames(srat_wb@meta.data)[1] <- "cell_type"
    srat_wb@meta.data$orig.ident <- "whole_blood"
    srat_wb@meta.data$orig.ident <- as.factor(srat_wb@meta.data$orig.ident)
    head(srat_wb[[]])
    • 1
    alt

    5基础质控

    做一下标准操作,计算线粒体基因和核糖体基因。🥳

    srat_wb <- SetIdent(srat_wb,value = "orig.ident")

    srat_wb[["percent.mt"]] <- PercentageFeatureSet(srat_wb, pattern = "^MT-")
    srat_wb[["percent.rbp"]] <- PercentageFeatureSet(srat_wb, pattern = "^RP[SL]")
    srat_3p[["percent.mt"]] <- PercentageFeatureSet(srat_3p, pattern = "^MT-")
    srat_3p[["percent.rbp"]] <- PercentageFeatureSet(srat_3p, pattern = "^RP[SL]")

    p1 <- VlnPlot(srat_wb, ncol = 4,
    features = c("nFeature_RNA","nCount_RNA","percent.mt","percent.rbp"))

    p2 <- VlnPlot(srat_3p, ncol = 4,
    features = c("nFeature_RNA","nCount_RNA","percent.mt","percent.rbp"))

    p1/p2
    • 1
    alt

    6交集基因

    whole blood dataset使用的是Cell Ranger GRCh38-2020A进行注释,与3’ PBMC dataset差的比较多,所以我们先看一下有多少共同基因吧。🤩

    # table(rownames(srat_3p) %in% rownames(srat_wb))
    common_genes <- rownames(srat_3p)[rownames(srat_3p) %in% rownames(srat_wb)]

    length(common_genes)
    • 1
    alt

    7过滤基因

    我们设置一下过滤条件,把一些表达过低或过高的细胞去掉,以及一些线粒体基因过高的细胞(细胞状态不佳)。✌️

    srat_3p <- subset(srat_3p, subset = nFeature_RNA > 500 & nFeature_RNA < 5000 & percent.mt < 15)
    srat_wb <- subset(srat_wb, subset = nFeature_RNA > 1000 & nFeature_RNA < 6000)

    srat_3p <- srat_3p[rownames(srat_3p) %in% common_genes,]
    srat_wb <- srat_wb[rownames(srat_wb) %in% common_genes,]
    • 1

    8数据整合

    8.1 合并为list

    wb_list <- list()
    wb_list[["pbmc10k_3p"]] <- srat_3p
    wb_list[["whole_blood"]] <- srat_wb
    • 1

    8.2 Normalization与特征基因

    for (i in 1:length(wb_list)) {
    wb_list[[i]] <- NormalizeData(wb_list[[i]], verbose = F)
    wb_list[[i]] <- FindVariableFeatures(wb_list[[i]], selection.method = "vst", nfeatures = 2000, verbose = F)
    }
    • 1

    8.3 寻找Anchors并整合数据

    wb_anchors <- FindIntegrationAnchors(object.list = wb_list, dims = 1:30)
    wb_seurat <- IntegrateData(anchorset = wb_anchors, dims = 1:30)
    rm(wb_list)
    rm(wb_anchors)
    • 1
    alt

    9整合效果可视化

    9.1 整合前

    DefaultAssay(wb_seurat) <- "RNA"
    wb_seurat <- NormalizeData(wb_seurat, verbose = F)
    wb_seurat <- FindVariableFeatures(wb_seurat, selection.method = "vst", nfeatures = 2000, verbose = F)
    wb_seurat <- ScaleData(wb_seurat, verbose = F)
    wb_seurat <- RunPCA(wb_seurat, npcs = 30, verbose = F)
    wb_seurat <- RunUMAP(wb_seurat, reduction = "pca", dims = 1:30, verbose = F)

    DimPlot(wb_seurat,reduction = "umap") +
    scale_color_npg()+
    plot_annotation(title = "10k 3' PBMC and whole blood, before integration")
    • 1
    alt

    9.2 整合后

    DefaultAssay(wb_seurat) <- "integrated"
    wb_seurat <- ScaleData(wb_seurat, verbose = F)
    wb_seurat <- RunPCA(wb_seurat, npcs = 30, verbose = F)
    wb_seurat <- RunUMAP(wb_seurat, reduction = "pca", dims = 1:30, verbose = F)

    DimPlot(wb_seurat, reduction = "umap") +
    scale_color_npg()+
    plot_annotation(title = "10k 3' PBMC and white blood cells, after integration")
    • 1
    alt

    10降维与聚类

    10.1 聚类可视化

    wb_seurat <- FindNeighbors(wb_seurat, dims = 1:30, k.param = 10, verbose = F)
    wb_seurat <- FindClusters(wb_seurat, verbose = F)

    ncluster <- length(unique(wb_seurat[[]]$seurat_clusters))

    mycol <- colorRampPalette(brewer.pal(8, "Set2"))(ncluster)

    DimPlot(wb_seurat,label = T, reduction = "umap",
    cols = mycol, repel = T) +
    NoLegend()
    • 1
    alt

    10.2 具体查看及可视化

    count_table <- table(wb_seurat@meta.data$seurat_clusters, 
    wb_seurat@meta.data$orig.ident)
    count_table

    #### 可视化
    count_table %>%
    as.data.frame() %>%
    ggbarstats(x = Var2,
    y = Var1,
    counts = Freq)+
    scale_fill_npg()
    • 1
    alt

    面包
    最后祝大家早日不卷!~

    需要示例数据的小伙伴,在公众号回复Merge2获取吧!

    点个在看吧各位~ ✐.ɴɪᴄᴇ ᴅᴀʏ 〰

    📍 往期精彩

    📍 🤨 Google | 谷歌翻译崩了我们怎么办!?(附完美解决方案)
    📍 🤩 scRNA-seq | 吐血整理的单细胞入门教程
    📍 🤔 Reticulate | 如何在Rstudio中优雅地调用Python!?
    📍 🤣 NetworkD3 | 让我们一起画个动态的桑基图吧~
    📍 🤩 RColorBrewer | 再多的配色也能轻松搞定!~
    📍 🧐 rms | 批量完成你的线性回归
    📍 🤒 CMplot | 连Nature上的曼哈顿图都卷起来啦
    📍 🤩 CMplot | 完美复刻Nature上的曼哈顿图
    📍 🤠 Network | 高颜值动态网络可视化工具
    📍 🤗 boxjitter | 完美复刻Nature上的高颜值统计图
    📍 🤫 linkET | 完美解决ggcor安装失败方案(附教程)
    📍 ......

    本文由 mdnice 多平台发布

  • 相关阅读:
    2.HTML元素、属性、标题
    训练专门化的大型语言模型(LLM)现在更简单了
    界面控件DevExpress WPF(v23.2)下半年发展路线图
    AVL树、红黑树、树堆、Splay
    java毕业设计校园资料分享平台mybatis+源码+调试部署+系统+数据库+lw
    【Java I/O 流】字节数组流:ByteArrayInputStream 和 ByteArrayOutputStream
    企业网站的制作流程是什么?设计和制作一个网站需要多长时间?
    自学Vue开发Dapp去中心化钱包(二)
    中国运动服行业并购重组机会及投融资战略研究咨询报告
    【已解决】spring-boot项目使用maven打包时出现BOOT-INF文件夹的问题
  • 原文地址:https://blog.csdn.net/m0_72224305/article/details/127618450
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号