scRNAseq上游分析

最近对单细胞转录组很感兴趣,就跑了一跑~
以下就是单细胞转录组的上游分析过程。
如有不对,请大家多多指点。

1.cellranger-3.1.0下载

官网地址:https://support.10xgenomics.com/single-cell-gene-expression/software/downloads/latest

大家可以自行观看,里面有链接,我就直接粘贴过来了

#创建工作目录
cd ~/project/
mkdir project_scrnaseq
#下载 Cell Ranger - 3.1.0
# 1.1个G的软件,确实够大了
wget -O cellranger-3.1.0.tar.gz "http://cf.10xgenomics.com/releases/cell-exp/cellranger-3.1.0.tar.gz?Expires=1571872225&Policy=eyJTdGF0ZW1lbnQiOlt7IlJlc291cmNlIjoiaHR0cDovL2NmLjEweGdlbm9taWNzLmNvbS9yZWxlYXNlcy9jZWxsLWV4cC9jZWxscmFuZ2VyLTMuMS4wLnRhci5neiIsIkNvbmRpdGlvbiI6eyJEYXRlTGVzc1RoYW4iOnsiQVdTOkVwb2NoVGltZSI6MTU3MTg3MjIyNX19fV19&Signature=Dc7MFkUeE2xZvqS4rD28J-UGlISoJjYv8~QuwDI8lO3TLoDidtwKlgWNqff8vrY8uWRwVrl2C-tIW~aNI3jbrtYSKKgh7J0nWCz3zo5apcOW24UUCuzs58F6Jk7PKCELI2I~9ZhEAPam3Nxp4FbdYOolEBep4rywEegxyuhJVNMPlaQ9HsC-Z66irU0DfJ-4Ng7Z6lfU~w2~sWeykGa6mGEWoo3qN4dMhcvYcgYZSNioUlghKGponKMLuBkEX5QNrYitAQtwMQksWuw8MZ~BDlwnoMMd~Rg01xQu7~X48e6Fk4wxzwPTe5cCzlWd1cJrOP9J84ed8zXGZrRBwE6-QQ__&Key-Pair-Id=APKAI7S6A5RYOXBWRPDA"
1571829287(1).png
#下载的是tar.gz格式的压缩包,所以接下来当然就是无情的解压它!
tar -xzvf cellranger-3.1.0.tar.gz
#可以自行安排是否需要添加环境变量~~ 
##我就没有添加,不过怎么用,自己舒服就好!

下载完软件包了,接下来其实就和普通的RNAseq其实是一样的
必须要做的就是:
参考基因组索引的构建
测序文件的比对

2.参考基因组索引的构建

1.模式生物参考基因组索引

对于模式生物,比如Human,Mouse 等等生物的参考基因组索引,cellranger官网都有链接,可以自行下载

https://support.10xgenomics.com/single-cell-gene-expression/software/downloads/latest

#Human GRCh38
wget http://cf.10xgenomics.com/supp/cell-exp/refdata-cellranger-GRCh38-3.0.0.tar.gz
#Human hg19
wget http://cf.10xgenomics.com/supp/cell-exp/refdata-cellranger-hg19-3.0.0.tar.gz
#Mouse
wget http://cf.10xgenomics.com/supp/cell-exp/refdata-cellranger-mm10-3.0.0.tar.gz
2.非模式生物参考基因组索引

对于一些研究比较少的物种,需要自己去构建参考基因组索引

其实cellranger的参数,在官网上都有体现,大家可以自行学习!

https://support.10xgenomics.com/single-cell-gene-expression/software/pipelines/latest/what-is-cell-ranger

在此,以拟南芥分析为例:

https://support.10xgenomics.com/single-cell-gene-expression/software/pipelines/latest/advanced/references

vim mkgtf.sh

#!/bin/bash
cellranger=/home/liuyue/project/project_scrnaseq/cellranger-3.1.0
database=/home/liuyue/project/project_scrnaseq/database
$cellranger/cellranger mkgtf $database/AT_10.gtf ./AT_10.filter.gtf \
         --attribute=gene_biotype:protein_coding \
                 --attribute=gene_biotype:lincRNA \
                 --attribute=gene_biotype:antisense \
                 --attribute=gene_biotype:IG_LV_gene \
                 --attribute=gene_biotype:IG_V_gene \
                 --attribute=gene_biotype:IG_V_pseudogene \
                 --attribute=gene_biotype:IG_D_gene \
                 --attribute=gene_biotype:IG_J_gene \
                 --attribute=gene_biotype:IG_J_pseudogene \
                 --attribute=gene_biotype:IG_C_gene \
                 --attribute=gene_biotype:IG_C_pseudogene \
                 --attribute=gene_biotype:TR_V_gene \
                 --attribute=gene_biotype:TR_V_pseudogene \
                 --attribute=gene_biotype:TR_D_gene \
                 --attribute=gene_biotype:TR_J_gene \
                 --attribute=gene_biotype:TR_J_pseudogene \
                 --attribute=gene_biotype:TR_C_gene

$cellranger/cellranger mkref --genome=AT \
    --fasta=$database/AT_10.fa \
    --genes=./AT_10.filter.gtf \
    --ref-version=3.1.0
#####可以看出,cellranger在进行参考基因组索引构建的时候,其实是使用了2个命令
cellranger mkgtf
cellranger mkref
#共同执行的

参考基因组构建的结果:
1571830499(1).png

4.单细胞转录组的比对

比对直接就是一个命令
cellranger count

vim count.sh
#!/bin/bash
clean=/home/liuyue/project/project_scrnaseq/clean
cellranger=/home/liuyue/project/project_scrnaseq/cellranger-3.1.0
ref=/home/liuyue/project/project_scrnaseq/reference/AT
$cellranger/cellranger count --id=AT_root \
    --transcriptome=$ref \
    --fastqs=$clean \
    --sample=SRRXXXXXX \
    --force-cells=8000
#需要注意的其实就是输入文件和输出文件的位置别搞错了就行

你可能感兴趣的:(scRNAseq上游分析)