2020-04-23 绘制Circos图之二 测序深度

RNA转录组测序完成后,会进行序列比对,得到的结果是BAM格式的文件。
首先将生成的bam文件进行排序,

samtools sort -@ 10 -o ./sort.bam/19-1.sorted.bam ./bam/19-1.bam ###将bam文件排序

查看bam文件,格式

samtools view -H /home/qinghai/my_first_circos/sort.bam/19-1.sorted.bam

hg19.genome数据的分布必须与下图一致


图片11.png

可以网上ucsc下载hg19.genome

sudo apt install mysql-client-core-8.0#
mysql --user=genome --host=genome-mysql.cse.ucsc.edu -A -e "select chrom, size from hg19.chromInfo" > hg19.genome

别的物种也可以使用

http://genome.ucsc.edu/cgi-bin/hgGateway hgsid=1053922007_v51fhzoNz3YBAcyy1CIAVQtaeqM9

图片2.png

人用hg19,鼠mm10,斑马鱼danRer11
如斑马鱼:mysql --user=genome --host=genome-mysql.cse.ucsc.edu -A -e "select chrom, size from danRer11
.chromInfo" > danRer11.genome

结果如下,和bam文件序列不一致,
图片12.png

按照bam文件格式序列进行修改,如果哪个染色体不需要,直接改为0,在这里我们只需要线粒体,其他都改为0


图片12.png

bedtools makewindows 生成滑窗区域文本,可以理解-s -w 的区别,不清楚的可以直接输入

bedtools makewindows获取帮助信息

sudo apt install mysql-client-core-8.0#安装
bedtools makewindows -g hg19.genome -w 10000000 #间隔1000000
chr1    0   10000000
chr1    10000000    20000000
chr1    20000000    30000000
chr1    30000000    40000000
$ bedtools makewindows -g hg19.genome -w 1000000 -s 500000
 chr1 0 1000000
 chr1 500000 1500000
 chr1 1000000 2000000
 chr1 1500000 2500000
 chr1 2000000 3000000
#bedtools makewindows -g hg19.genome -w 10000000 -s 1000000 > windows.bed
#or bedtools makewindows -g hg19.genome -w 100 -s 50 > windows.bed ##线粒体
bedtools makewindows -g hg19.genome -w 100  > windows.bed

> ### 注意需要删掉genome文件第一行, 要不然会一直报错

chrom size
chr4 78093715
chr7 74282399
chr5 72500376
chr3 62628489
chr6 60270059
chr2 59640629
...

结果如下,三列


图片12.png

bedtools makewindows用来自动生成划窗区间。-g genome.txt是要划分的基因组,格式为两列:染色体、染色体长度;-w 10000000为窗口大小为10M;-s 1000000为步长为1M,即窗口在染色体上每次向右平移1M的距离;windows.bed为输出文件,格式为三列:染色体、区间开始位点、区间结束位点。
自己编写hg19.txt或genome容易出错,需要通过mysql下载hg19.genome,然后根据需要进行修改才行。
线粒体测序深度结果运行

bedtools coverage -mean -sorted -g hg19.genome -a  windows.bed -b /home/qinghai/my_first_circos/sort.bam/19-1.sorted.bam> 19-1.depth.txt
#

生成结果如下:
图片12.png

这个结果还无法导入到mitochondrion.conf文件中,需要修改为下面的图。可通过excel编辑


图片12.png
karyotype.tair10.txt 中的信息 为,需要与之对应,因此第一列改为NC_027757.2
chr - NC_027757.2 human_mito 0 16596 chr1

如果需要区分正负链

bedtools makewindows -g hg191.genome -w 10 -i winnum > windows.bed
需要加上-i winnum
-i winnum" - use the window number as the ID (e.g. 1,2,3,4...).

图片12.png

再通过excel编辑,在后面加上两列,特别是第六列改为+
图片13.png

bedtools coverage -mean -sorted -g hg19.genome -a  windows.bed -b /home/qinghai/my_first_circos/sort.bam/19-1.sorted.bam -s> 19-1plus.depth.txt
###正链深度表
bedtools coverage -mean -sorted -g hg19.genome -a  windows.bed -b /home/qinghai/my_first_circos/sort.bam/19-1.sorted.bam -S> 19-1minus.depth.txt
###负链深度表
图片12.png

EXCEL中删除4,5,6列,并加上标题


图片12.png

编辑mitochondrion.conf, 运行程序

circos -conf mitochondrion.conf --outputdir Figure -outputfile Single35
#  --outputdir Figure  输出文件夹位置,
#   -outputfile Single35  输出文件名字

最终mitochondrion.conf 文件内容

#以下几列和部分是画染色体的
karyotype = single_chr.txt#karyotype.txt的路径
chromosomes_order_by_karyotype = yes #是否按照karyotype.txt文件中的顺序来画染色体
chromosomes_units              = 20 #将1000000碱基看作一个染色体单元
chromosomes_display_default    = yes #是否展示全部染色体
                                     #如果是no,则需要重新设置染色体,比如: chromosomes = 染色体1名称;染色体2名称
#设置染色体颜色chromosomes_color = 染色体1名称=red;染色体2名称=vvdred;染色体3名称=vvlred
#其实只要将karyotype.txt最后一列定义为chr1-chrN即可;当然上面这种方法是可以的,不过很麻烦,且一时也想不到那么多颜色
######################################################

show = yes
radius=0.9r###less than 1r
thickness = 0p #染色体的宽度0-30
fill = no #是否填充

#设定ideograms轮廓,就是在染色体外边框加线
#stroke_thickness = 1
#stroke_color = black

#染色体外圈的标签,比如chr1A、chr2A......
show_label = yes
label_font = default
label_radius=1r+90p
label_size=40
label_parallel = yes

#染色体之间的间隔

default = 0.005r
# #在特定的两条染色体之间加上自定义的距离
#spacing = 3r
#



######################################################
#下面就是plot部分了,比如我要画一个snp密度图,和gene密度图
###########
###First circle
type = histogram###choose histogram not line chart
thickness = 0.0  # 控制线条的粗细
max_gap = 1u #每隔1个单位画一条分割线
file = mitochondrion_plus_polya.txt
color = black#边框颜色,控制线条的颜色
fill_color = black_a4 #控制填充色,在折线的下方进行颜色填充
#orientation = in #orientation = in代表 y = 0 位于r1上;orientation = out表示y = 0位于r0 上
min    = 0
max    = 1000 #设置y轴的范围,超过的部分显示不了
r0     = 0.93r
r1     = 0.99r


color     = lgreen
thickness = 2
position  = 0.1   #通过position直接设置轴线的位置,适合指定单条轴线,such as different kind of line including color, thickness
###spacing=0.05r ## drawing multiple axes at equal intervals


color     = lred
thickness = 2
position  = 0.002###drawing a red axe in position 0.002




color     = lred
thickness = 1

#spacing   = 0.15r####间隔线用#y0, y1指定范围,再用spacing参数设定间隔的用法, 这种用法可以方便的设置多条轴线




#background=transparent
color     = 0,255,255,0.5 #  透明度设置说明; RGB颜色由三位数三组组成(网页可以查询);0.2是0-1直接的一个数字,越趋于0,透明度越高
#y0        = 0.006


color     = vvlred
y1        = 0.002



#orientation控制y轴0点的位置,orientation = in代表 y = 0 位于r1上;orientation = out表示y = 0位于r0 上

###############################################
#Second circle
thickness = 0.5p
# 3. 第2圈:形状色块
show = yes
type = line  # 类型:scatter/line/histogram/heatmap

file =19-14plus.depth.txt  # 指定文件
r0 = 0.86r
r1 = 0.92r
max = 300000.0
min = 1000.0
orientation = out  # 方向:朝外
#glyph = rectangle  # 散点形状:circle/triangle/rectangle
#glyph_size = 20  # 散点大小
fill_color = 0,0,0  # 填充色:红色
stroke_color = 0,0,0  # 边框色:红色
stroke_thickness = 0.5


color     = 192,192,192,0.5
y0        = 0.006


color     = vvlgrey
y1        = 0.002



###########################################################################

type = highlight####高亮的区域type=histogram##数据展示情况,可以选择直方图、直线、散点、热图等
file = mitochondrion.txt
r1 = 0.8r
r0 = 0.85r
fill = no
stroke_color = green          # 边框色:红色
stroke_thickness = 0p###0 means none
fill_color = 255,255,0 #white填充颜色

##################################################

type = highlight
file = highligt.txt  # 高亮
fill_color = nothing  # RGB指定高亮颜色
r0 = 0.73r  # 内径
r1 = 0.78r  # 外径
stroke_color = green          # 边框色:红色
stroke_thickness = 0.00###0 means none   


##################################################

thickness = 0.5p
# 3. 第三圈:形状色块
show = yes
type = line  # 类型:scatter/line/histogram/heatmap

file = 19-14plusminus.depth.txt  # 指定文件
r0 = 0.66r
r1 = 0.72r
max = 300000.0
min = 1000.0
orientation = in  # 方向:朝外
#glyph = rectangle  # 散点形状:circle/triangle/rectangle
#glyph_size = 20  # 散点大小
fill_color = 0,0,0  # 填充色:红色
stroke_color = 0,0,0  # 边框色:红色
stroke_thickness = 0.5


color     = 192,192,192,0.5
y0        = 0.006


color     = vvlgrey
y1        = 0.002



###################################################

type = histogram  

z = 2
max_gap = 0u
file = mitochondrion_minus_polya.txt  # 柱状图

color = black#边框颜色,控制线条的颜色
fill_color = black_a4 #控制填充色,在折线的下方进行颜色填充
r0 = 0.6r
r1 = 0.65r
orientation = in  # 方向:朝in
min    = 0
max    = 100 #设置y轴的范围,超过的部分显示不了


#background=transparent
color     = 0,255,255,0.5 #  透明度设置说明; RGB颜色由三位数三组组成(网页可以查询);0.2是0-1直接的一个数字,越趋于0,透明度越高
#y0        = 0.006


color     = vvlred
y1        = 0.002





##################################################
#
    #z = 0
    #
        #file = /home/qinghai/my_first_circos/highligt.txt  # 高亮
        #fill_color = 0,0,0  # RGB指定高亮颜色
        #r0 = 0.45r  # 内径
        #r1 = 0.5r  # 外径
    #
#
######################################################
#以下部分是画染色体刻度的
show_ticks = yes
show_tick_labels = yes
show_grid       = yes

z=5# z值越大,表明这个hightlights的优先级越高,在与其他highlights重叠时,优先级越高的越先显示。
tick_label_font  = light
radius=1.01r
radius=0.57r
color = black
thickness = 2p
multiplier = 1e-0 #multiplier = 1e-6物理位置乘以这个数来表示刻度位置,比如物理位置是10000000位碱基,则在刻度上为10
format=%d #刻度位置显示为十进制整数format的意思:%d 表示结果为整数;%f 结果为浮点数; %.1f 结果为小数点后保留1位; %.2f 结果为小数点后保留2位

#设置标尺上的大刻度


spacing = 50u #10个染色体单元,即10000000碱基长度
size = 18p
show_label=no
#设置ticks'label离ticks的距离
label_offset = 30p
#设置ticks'label的字体大小
label_size = 30p

#设置标尺上的小刻度

spacing = 5u
size = 8p


z=5
# 说明该设置只限于特定染色体,添加前后刻度连接线
chromosomes_display_default = yes
chromosomes         = chr1
spacing         = 5u
# 这里由于spacing设置的是5u,所以此时size会被tick1和tick2替换,故无需设置
size                = 0p
force_display           = yes
# grid起始位置
grid_start          = 0.59r
# grid终止位置,设置与外圈tick相同,使整体美观
grid_end            = 1.01r
grid_color          = 232,232,232# grey
grid_thickness          = 2p
grid                = yes




######################################################
#以下部分可以不用更改

<>

<>
<>

single_chr.txt 内容

chr - NC_027757.2 human_mito 0 16596 chr1
mitochondrion_plus_polya.txt 内容
ID Start End Count
NC_027757.2 36 41 0
NC_027757.2 71 76 0
NC_027757.2 106 111 0
NC_027757.2 141 146 0
NC_027757.2 183 188 2
NC_027757.2 211 216 7
NC_027757.2 246 251 0
NC_027757.2 281 286 0
NC_027757.2 316 321 0
NC_027757.2 351 356 0
NC_027757.2 386 391 0
NC_027757.2 421 426 0
NC_027757.2 456 461 0
NC_027757.2 491 496 0
NC_027757.2 567 572 3
...............

mitochondrion.txt 内容

NC_027757.2 577 647 fill_color=vlpred
NC_027757.2 648 1601 fill_color=vlppurple
NC_027757.2 1602 1670 fill_color=vlporange
NC_027757.2 1671 3229 fill_color=vlyellow
NC_027757.2 3220 3304 fill_color=vlpred
NC_027757.2 3307 4262 fill_color=vlppurple
NC_027757.2 4263 4331 fill_color=vlporange
NC_027757.2 4402 4469 fill_color=vlyellow
NC_027757.2 4470 5511 fill_color=vlpred
NC_027757.2 5512 5579 fill_color=vlppurple
NC_027757.2 5904 7445 fill_color=vlporange
NC_027757.2 7518 7585 fill_color=vlyellow
NC_027757.2 7586 8269 fill_color=vlpred
NC_027757.2 8295 8364 fill_color=vlppurple
NC_027757.2 8366 8572 fill_color=vlporange
NC_027757.2 8527 9207 fill_color=vlyellow
NC_027757.2 9207 9990 fill_color=vlpred
NC_027757.2 9991 10058 fill_color=vlppurple
NC_027757.2 10059 10404 fill_color=vlporange
NC_027757.2 10405 10469 fill_color=vlyellow
NC_027757.2 10470 10766 fill_color=vlpred
NC_027757.2 10760 12137 fill_color=vlppurple
NC_027757.2 12138 12206 fill_color=vlporange
NC_027757.2 12207 12265 fill_color=vlyellow
NC_027757.2 12266 12336 fill_color=vlpred
NC_027757.2 12337 14148 fill_color=vlppurple
NC_027757.2 14747 15887 fill_color=vlporange
NC_027757.2 15883 15953 fill_color=vlyellow

highligt.txt 内容

NC_027757.2 4339 4400 fill_color=vlporange
NC_027757.2 5587 5655 fill_color=vlporange
NC_027757.2 5657 5729 fill_color=vlppurple
NC_027757.2 5761 5826 fill_color=vlporange
NC_027757.2 5827 5891 fill_color=vlpurple
NC_027757.2 7446 7514 fill_color=vlporange
NC_027757.2 14149 14673 fill_color=vlppurple
NC_027757.2 14674 14742 fill_color=vlporange
NC_027757.2 15956 16023 fill_color=vlppurple

19-14plusminus.depth.txt 内容

ID Start End Count
NC_027757.2 0 10 3276.399902
NC_027757.2 10 20 4897.100098
NC_027757.2 20 30 6683.700195
NC_027757.2 30 40 9275.700195
NC_027757.2 40 50 13224.40039
NC_027757.2 50 60 14929.7002
NC_027757.2 60 70 17682.69922
NC_027757.2 70 80 19832
NC_027757.2 80 90 20589.80078
NC_027757.2 90 100 20817.90039
NC_027757.2 100 110 21192.30078
NC_027757.2 110 120 21874.40039
NC_027757.2 120 130 22982
NC_027757.2 130 140 23440.5
................

mitochondrion_minus_polya.txt 内容

ID Start End Count
NC_027757.2 16551 16546 7
NC_027757.2 16522 16517 3
NC_027757.2 16488 16483 2
NC_027757.2 16461 16456 3
NC_027757.2 16417 16412 3
NC_027757.2 16394 16389 0
NC_027757.2 16347 16342 2
NC_027757.2 16324 16319 0
NC_027757.2 16289 16284 0
NC_027757.2 16254 16249 0
NC_027757.2 16219 16214 0
NC_027757.2 16184 16179 0
NC_027757.2 16149 16144 0
NC_027757.2 16110 16105 1
NC_027757.2 16062 16057 12

你可能感兴趣的:(2020-04-23 绘制Circos图之二 测序深度)