10x单细胞数据上游分析

1. 下载cellranger, 这里下载的是6.0最新版本

$ wget -O cellranger-6.0.1.tar.gz "https://cf.10xgenomics.com/releases/cell-exp/cellranger-6.0.1.tar.gz?Expires=1618687264&Policy=eyJTdGF0ZW1lbnQiOlt7IlJlc291cmNlIjoiaHR0cHM6Ly9jZi4xMHhnZW5vbWljcy5jb20vcmVsZWFzZXMvY2VsbC1leHAvY2VsbHJhbmdlci02LjAuMS50YXIuZ3oiLCJDb25kaXRpb24iOnsiRGF0ZUxlc3NUaGFuIjp7IkFXUzpFcG9jaFRpbWUiOjE2MTg2ODcyNjR9fX1dfQ__&Signature=Gp1U4ar6QlhQfqXiCEjMQFQ9o0GH-~WoMJmVYO1V-aSvmLGoYYjg~rbwBvoLtVSEGiYFahjj6TM3mFWEWjoLF7Z0vlsxLpHb0gvEMnH1YhUAxC3NBaLquRyXNhVETkY2Nk98z6nnC5j1RnvWq8CqRH1DU3Dbz8jV6iQTl4dQkLlYxWfOUgwy~2Dkzc6z6VrPw6kj0xllei9Rq8Pn6SkHI9k8ulGO3ys8sMQknw-9RLzENqQpEdy86fs1ehLaxR3DZDu97In-WrcR2QjBjEvLnOTOMTuU4-0E9WoUYBmsMTD9jr0w1vbh1agMx0LdMRzDP4X~1lcD~1hGwRK9Zx-ohg__&Key-Pair-Id=APKAI7S6A5RYOXBWRPDA"

2. 下载cellranger专用的参考基因组, 10x官网提供了小鼠和人的参考基因组信息, 包括gtf, fa等

$ wget https://cf.10xgenomics.com/supp/cell-exp/refdata-gex-mm10-2020-A.tar.gz

3. 下载单细胞SRA数据, 使用sratoolkit中的prefetch

$ prefetch SRR12318312.sra
$ prefetch SRR12318316.sra

4. 转换为fastq, 使用sra-tools中的fastq-dump

$ fastq-dump --split-files --origfmt --gzip SRR12318312.sra
$ fastq-dump --split-files --origfmt --gzip SRR12318316.sra

这里只输出了两个文件, 但是看别的教程都是三个文件, 包含barcode, umi和reads, 最后跑的时候也没报错

5. 将输出的fastq文件改名为cellranger的格式

$ mv SRR12318312_1.fastq.gz SRR12318312_S1_L001_R1_001.fastq.gz
$ mv SRR12318312_2.fastq.gz SRR12318312_S1_L001_R2_001.fastq.gz
$ mv SRR12318316_1.fastq.gz SRR12318316_S1_L002_R1_001.fastq.gz
$ mv SRR12318316_2.fastq.gz SRR12318316_S1_L002_R2_001.fastq.gz

6. 运行cellranger count命令获取表达矩阵

  • id: 代表输出文件目录, 会自动创建
  • sample: 输入fastq文件的前缀
  • fastqs: 输入文件的路径
  • transcriptome: 参考基因组的路径
  • localmem: 内存限制(GB), 适用于本地程序
  • localcores: 线程数, 适用于本地程序
$ cellranger count --id=stemCells --sample=SRR12318312,SRR12318316 --fastqs . --transcriptome=/path/to/refdata-gex-mm10-2020-A --localmem 10 --localcores 8
最终输出结果

你可能感兴趣的:(10x单细胞数据上游分析)