有意思的单细胞CITEseq文库结构

有意思的CITEseq文库结构。

理解CITEseq的文库结构,有助于在分析数据的过程中更好地troubleshooting.

首先来看CITEseq文库结构图,我标注了一些信息在上面:如下图

image.png

我们来看看cell barcode在read1中的位置为前16bp, 然后紧接着跟了10bp的UMI,然后是13bp的TTTCTTATATGGG固定序列+ 9bp的随机序列N + 15bp Antibody barcode的反向互补序列 + 10bp随机序列N + 34bp Read 2N + 8bp sample index + P7

image.png

ps: 从34bpRead2N开始到p7结束这些完全是多余的.

再来看read2 : 10bp 的随机序列N + 15bp antibody barcode + 9bp N + 13bp固定序列 + 10bp UMI + 16bp cell barcode + read1 + p5.

image.png

PS:是从文库结构图的P7到P5方向测过来的。

稍微解释一下:

在图read1结构中的15bp Antibody barcode序列为:TTAATGTCGTCCGGC,它的反向互补序列为:GCCGGACGACATTAA , 正是IgG1的Antibody barcode序列(如下图配置文件).

image.png

总结:

采用PE150这样的测序方式,会在read1和read2中重复测很多不必要的序列,有点浪费,其实SE100完全满足这样的文库, 但目前illumina只提供最少PE150的测序方案, 这也是最便宜的方案了. 就只能这样用。

你可能感兴趣的:(有意思的单细胞CITEseq文库结构)