Motivation
臭写代码的最近在搞生物信息相关的东西,拿来发现好多单位、名词都不知道是什么。记录一下方便自己和大家学习。
单位
- bp(Base pair):碱基对,用来表示DNA序列的长度。
- reads: 读长,测序仪单次测序所得到的碱基序列
名词
- cohort study:队列研究
队列研究是将某一特定人群按是否暴露于某可疑因素或暴露程度分为不同的亚组,追踪观察两组或多组成员结局(如疾病)发生的情况,比较各组之间结局发生率的差异,从而判定这些因素与该结局之间有无因果关联及关联程度的一种观察性研究方法。 - sensitivity:灵敏度
指已知样本为真的情况下,检测结果是阳性的概率。(也就是召回率Recall) - imputation:基因型填充
对基因型缺失的位点进行填补(Imputation)对这个位点的基因型规律进行总结,然后对缺失位点归到某类中,赋予其一个最可能的基因型。而基因型缺失missing主要有两种可能:
- 遗传性缺失:个体遗传信息的变异而导致这个位点的DNA片段是真实的缺失
- 技术型缺失:由于探针杂交效率低,或多是测序深度较低,导致一些位点是未被测到,不可避免会产生大量的随机缺失
- 参考链接
- haplotype:单倍型
参考链接 - single-nucleotide variant (SNV):单核苷酸突变
- 与SNP(单核苷酸多态性)的区别:SNP就是一种生殖/种系变异,是可以遗传的,而且在人群中频率大于1%。SNV就只是体细胞变异。(参考)
- gene coexpression network:基因共表达网络,参考:https://blog.csdn.net/aganlala/article/details/115396351
Next Generation Sequencing (NGS)
Sanger(traditional) Sequencing
DNA变性,加入荧光终止子
Illumina Sequencing
Oxford Nanopore 纳米孔测序
Pacific Bioscience Sequencing
不需要移除荧光,荧光链接在磷酸基团上,核苷酸连接到DNA上后会自动脱落。
参考链接
- 参考视频
- 参考视频