cellranger count使用

1、如果你是直接拿到的R1/R2的fastq文件,那么就直接上cellranger count。氮素,如果你是I1/R1/R2的数据,那就麻烦还要跑个cellranger mkfastq。因为我自己拿到的是R1/R2的fastq文件(如图),所以抱歉啦就直接从cellranger count开始讲起啦。嘻嘻嘻~~~


image.png

这里有个问题(划重点):图中所示,我的名字是CC5-1_S1XXXX。但是cellranger count当中的--sample参数只识别的时候只识别S1之前的字段,所以我每次只能一对文件。那么问题来了,图中的四对样本来自于同一群细胞,我想将这四个文件一起一次性跑完,怎么办呢?

cat CC5F0-1_S1_L003_R1_001.fastq.gz CC5F0-2_S1_L003_R1_001.fastq.gz CC5F0-3_S1_L003_R1_001.fastq.gz CC5F0-4_S1_L003_R1_001.fastq.gz > CC5F0_S1_L003_R1_001.fastq.gz

R2文件同样的办法,完美解决。
2、cellranger count的参数其实蛮简单,重要的参数就那几个。

/software/cellranger-4.0.0/cellranger count \
--id=cellranger_CC5 \
--fastqs=rawdata \
--sample=HCC5F5 \
--transcriptome=/reference/refdata-gex-GRCh38-2020-A

--id= 就是给你这次的任务取一个响亮的名字,自己随意。
--fastqs= 就是你的fastq.gz文件保存的路径,完整的哈。
--sample= 就是你的fastq.gz文件名当中S1之前的字段,这就是为啥有前面第一步的cat。
--transcriptome= 就是你的参考基因组,下载链接见我上一篇(cellranger安装)
3、按下回车键,让它开始运行吧。
4、结果解读。
cellranger count会得到一大堆结果。而内容就保存在你刚才创建的cellranger_CC5目录当中。最直观的结果是web_summary.html,这个结果会展示你测序的细胞数量,以及每个细胞的基因数量。如图:


image.png

image.png

5、另外的在outs目录下filtered_gene_bc_matrices目录:超级重要的一个目录,下面又包含了 barcodes.tsv.gz、features.tsv.gz、matrix.mtx.gz,是下游Seurat、Scater、Monocle等分析的输入文件。
6、算了,先都保存下来吧,后面的会持续更新。

你可能感兴趣的:(cellranger count使用)