从10X单细胞bam文件中提取某一个细胞类型的bam

我们之前简单做了一下cellranger的上游分析单细胞上游软件cellranger从头说,得到的结果文件如下:


如果我们要做下游分析,那么三个文件matrix.mtx,barcodes.tsv 和 genes.tsv存在于out/filtered_feature_bc_matrix文件夹下
我们之前也简单介绍了一下这三个文件的构造单细胞表达矩阵文件转换,那么我们在下游分析中,细胞分群以后,我们会得到一些细胞亚群中的细胞信息,我们后续往往可能会把某一个细胞亚群的那一些细胞单独提取出来做后续分析

熟悉单细胞表达矩阵的同学一定知道,单细胞表达谱的行名为基因,列名为细胞(本质上是利用barcodes进行区分):


data

那么比方说我们想要提取第一列这个细胞的bam文件怎么办?
我们在out/filtered_feature_bc_matrix文件夹下找到 possorted_genome_bam.bam 利用samtools 和 barcodes 进行提取:

samtools view possorted_genome_bam.bam -h | sed -n "/^@\|AAACCTGAGCGAAGGG-1/p" | samtools view -b > AAACCTGAGCGAAGGG.bam

类似的,我们可以将某一个细胞亚型的全部细胞通过这种方式进行提取,得到该细胞类型的全部bam文件

参考:传送门

你可能感兴趣的:(从10X单细胞bam文件中提取某一个细胞类型的bam)