RNA转录组测序完成后,会进行序列比对,得到的结果是BAM格式的文件。
首先将生成的bam文件进行排序,
samtools sort -@ 10 -o ./sort.bam/19-1.sorted.bam ./bam/19-1.bam ###将bam文件排序
查看bam文件,格式
samtools view -H /home/qinghai/my_first_circos/sort.bam/19-1.sorted.bam
hg19.genome数据的分布必须与下图一致
可以网上ucsc下载hg19.genome
sudo apt install mysql-client-core-8.0#
mysql --user=genome --host=genome-mysql.cse.ucsc.edu -A -e "select chrom, size from hg19.chromInfo" > hg19.genome
结果如下,和bam文件序列不一致,别的物种也可以使用
http://genome.ucsc.edu/cgi-bin/hgGateway hgsid=1053922007_v51fhzoNz3YBAcyy1CIAVQtaeqM9
人用hg19,鼠mm10,斑马鱼danRer11
如斑马鱼:mysql --user=genome --host=genome-mysql.cse.ucsc.edu -A -e "select chrom, size from danRer11
.chromInfo" > danRer11.genome
按照bam文件格式序列进行修改,如果哪个染色体不需要,直接改为0,在这里我们只需要线粒体,其他都改为0
bedtools makewindows 生成滑窗区域文本,可以理解-s -w 的区别,不清楚的可以直接输入
bedtools makewindows获取帮助信息
sudo apt install mysql-client-core-8.0#安装
bedtools makewindows -g hg19.genome -w 10000000 #间隔1000000
chr1 0 10000000
chr1 10000000 20000000
chr1 20000000 30000000
chr1 30000000 40000000
$ bedtools makewindows -g hg19.genome -w 1000000 -s 500000
chr1 0 1000000
chr1 500000 1500000
chr1 1000000 2000000
chr1 1500000 2500000
chr1 2000000 3000000
#bedtools makewindows -g hg19.genome -w 10000000 -s 1000000 > windows.bed
#or bedtools makewindows -g hg19.genome -w 100 -s 50 > windows.bed ##线粒体
bedtools makewindows -g hg19.genome -w 100 > windows.bed
> ### 注意需要删掉genome文件第一行, 要不然会一直报错
chrom size
chr4 78093715
chr7 74282399
chr5 72500376
chr3 62628489
chr6 60270059
chr2 59640629
...
结果如下,三列
bedtools makewindows用来自动生成划窗区间。-g genome.txt是要划分的基因组,格式为两列:染色体、染色体长度;-w 10000000为窗口大小为10M;-s 1000000为步长为1M,即窗口在染色体上每次向右平移1M的距离;windows.bed为输出文件,格式为三列:染色体、区间开始位点、区间结束位点。
自己编写hg19.txt或genome容易出错,需要通过mysql下载hg19.genome,然后根据需要进行修改才行。
线粒体测序深度结果运行
bedtools coverage -mean -sorted -g hg19.genome -a windows.bed -b /home/qinghai/my_first_circos/sort.bam/19-1.sorted.bam> 19-1.depth.txt
#
生成结果如下:
这个结果还无法导入到mitochondrion.conf文件中,需要修改为下面的图。可通过excel编辑
chr - NC_027757.2 human_mito 0 16596 chr1
如果需要区分正负链
bedtools makewindows -g hg191.genome -w 10 -i winnum > windows.bed
需要加上-i winnum
-i winnum" - use the window number as the ID (e.g. 1,2,3,4...).
再通过excel编辑,在后面加上两列,特别是第六列改为+
bedtools coverage -mean -sorted -g hg19.genome -a windows.bed -b /home/qinghai/my_first_circos/sort.bam/19-1.sorted.bam -s> 19-1plus.depth.txt
###正链深度表
bedtools coverage -mean -sorted -g hg19.genome -a windows.bed -b /home/qinghai/my_first_circos/sort.bam/19-1.sorted.bam -S> 19-1minus.depth.txt
###负链深度表
EXCEL中删除4,5,6列,并加上标题
编辑mitochondrion.conf, 运行程序
circos -conf mitochondrion.conf --outputdir Figure -outputfile Single35
# --outputdir Figure 输出文件夹位置,
# -outputfile Single35 输出文件名字
最终mitochondrion.conf 文件内容
#以下几列和部分是画染色体的
karyotype = single_chr.txt#karyotype.txt的路径
chromosomes_order_by_karyotype = yes #是否按照karyotype.txt文件中的顺序来画染色体
chromosomes_units = 20 #将1000000碱基看作一个染色体单元
chromosomes_display_default = yes #是否展示全部染色体
#如果是no,则需要重新设置染色体,比如: chromosomes = 染色体1名称;染色体2名称
#设置染色体颜色chromosomes_color = 染色体1名称=red;染色体2名称=vvdred;染色体3名称=vvlred
#其实只要将karyotype.txt最后一列定义为chr1-chrN即可;当然上面这种方法是可以的,不过很麻烦,且一时也想不到那么多颜色
######################################################
show = yes
radius=0.9r###less than 1r
thickness = 0p #染色体的宽度0-30
fill = no #是否填充
#设定ideograms轮廓,就是在染色体外边框加线
#stroke_thickness = 1
#stroke_color = black
#染色体外圈的标签,比如chr1A、chr2A......
show_label = yes
label_font = default
label_radius=1r+90p
label_size=40
label_parallel = yes
#染色体之间的间隔
default = 0.005r
# #在特定的两条染色体之间加上自定义的距离
#spacing = 3r
#
######################################################
#下面就是plot部分了,比如我要画一个snp密度图,和gene密度图
###########
###First circle
type = histogram###choose histogram not line chart
thickness = 0.0 # 控制线条的粗细
max_gap = 1u #每隔1个单位画一条分割线
file = mitochondrion_plus_polya.txt
color = black#边框颜色,控制线条的颜色
fill_color = black_a4 #控制填充色,在折线的下方进行颜色填充
#orientation = in #orientation = in代表 y = 0 位于r1上;orientation = out表示y = 0位于r0 上
min = 0
max = 1000 #设置y轴的范围,超过的部分显示不了
r0 = 0.93r
r1 = 0.99r
color = lgreen
thickness = 2
position = 0.1 #通过position直接设置轴线的位置,适合指定单条轴线,such as different kind of line including color, thickness
###spacing=0.05r ## drawing multiple axes at equal intervals
color = lred
thickness = 2
position = 0.002###drawing a red axe in position 0.002
color = lred
thickness = 1
#spacing = 0.15r####间隔线用#y0, y1指定范围,再用spacing参数设定间隔的用法, 这种用法可以方便的设置多条轴线
#background=transparent
color = 0,255,255,0.5 # 透明度设置说明; RGB颜色由三位数三组组成(网页可以查询);0.2是0-1直接的一个数字,越趋于0,透明度越高
#y0 = 0.006
color = vvlred
y1 = 0.002
#orientation控制y轴0点的位置,orientation = in代表 y = 0 位于r1上;orientation = out表示y = 0位于r0 上
###############################################
#Second circle
thickness = 0.5p
# 3. 第2圈:形状色块
show = yes
type = line # 类型:scatter/line/histogram/heatmap
file =19-14plus.depth.txt # 指定文件
r0 = 0.86r
r1 = 0.92r
max = 300000.0
min = 1000.0
orientation = out # 方向:朝外
#glyph = rectangle # 散点形状:circle/triangle/rectangle
#glyph_size = 20 # 散点大小
fill_color = 0,0,0 # 填充色:红色
stroke_color = 0,0,0 # 边框色:红色
stroke_thickness = 0.5
color = 192,192,192,0.5
y0 = 0.006
color = vvlgrey
y1 = 0.002
###########################################################################
type = highlight####高亮的区域type=histogram##数据展示情况,可以选择直方图、直线、散点、热图等
file = mitochondrion.txt
r1 = 0.8r
r0 = 0.85r
fill = no
stroke_color = green # 边框色:红色
stroke_thickness = 0p###0 means none
fill_color = 255,255,0 #white填充颜色
##################################################
type = highlight
file = highligt.txt # 高亮
fill_color = nothing # RGB指定高亮颜色
r0 = 0.73r # 内径
r1 = 0.78r # 外径
stroke_color = green # 边框色:红色
stroke_thickness = 0.00###0 means none
##################################################
thickness = 0.5p
# 3. 第三圈:形状色块
show = yes
type = line # 类型:scatter/line/histogram/heatmap
file = 19-14plusminus.depth.txt # 指定文件
r0 = 0.66r
r1 = 0.72r
max = 300000.0
min = 1000.0
orientation = in # 方向:朝外
#glyph = rectangle # 散点形状:circle/triangle/rectangle
#glyph_size = 20 # 散点大小
fill_color = 0,0,0 # 填充色:红色
stroke_color = 0,0,0 # 边框色:红色
stroke_thickness = 0.5
color = 192,192,192,0.5
y0 = 0.006
color = vvlgrey
y1 = 0.002
###################################################
type = histogram
z = 2
max_gap = 0u
file = mitochondrion_minus_polya.txt # 柱状图
color = black#边框颜色,控制线条的颜色
fill_color = black_a4 #控制填充色,在折线的下方进行颜色填充
r0 = 0.6r
r1 = 0.65r
orientation = in # 方向:朝in
min = 0
max = 100 #设置y轴的范围,超过的部分显示不了
#background=transparent
color = 0,255,255,0.5 # 透明度设置说明; RGB颜色由三位数三组组成(网页可以查询);0.2是0-1直接的一个数字,越趋于0,透明度越高
#y0 = 0.006
color = vvlred
y1 = 0.002
##################################################
#
#z = 0
#
#file = /home/qinghai/my_first_circos/highligt.txt # 高亮
#fill_color = 0,0,0 # RGB指定高亮颜色
#r0 = 0.45r # 内径
#r1 = 0.5r # 外径
#
#
######################################################
#以下部分是画染色体刻度的
show_ticks = yes
show_tick_labels = yes
show_grid = yes
z=5# z值越大,表明这个hightlights的优先级越高,在与其他highlights重叠时,优先级越高的越先显示。
tick_label_font = light
radius=1.01r
radius=0.57r
color = black
thickness = 2p
multiplier = 1e-0 #multiplier = 1e-6物理位置乘以这个数来表示刻度位置,比如物理位置是10000000位碱基,则在刻度上为10
format=%d #刻度位置显示为十进制整数format的意思:%d 表示结果为整数;%f 结果为浮点数; %.1f 结果为小数点后保留1位; %.2f 结果为小数点后保留2位
#设置标尺上的大刻度
spacing = 50u #10个染色体单元,即10000000碱基长度
size = 18p
show_label=no
#设置ticks'label离ticks的距离
label_offset = 30p
#设置ticks'label的字体大小
label_size = 30p
#设置标尺上的小刻度
spacing = 5u
size = 8p
z=5
# 说明该设置只限于特定染色体,添加前后刻度连接线
chromosomes_display_default = yes
chromosomes = chr1
spacing = 5u
# 这里由于spacing设置的是5u,所以此时size会被tick1和tick2替换,故无需设置
size = 0p
force_display = yes
# grid起始位置
grid_start = 0.59r
# grid终止位置,设置与外圈tick相同,使整体美观
grid_end = 1.01r
grid_color = 232,232,232# grey
grid_thickness = 2p
grid = yes
######################################################
#以下部分可以不用更改
<>
<>
<>
single_chr.txt 内容
chr - NC_027757.2 human_mito 0 16596 chr1
mitochondrion_plus_polya.txt 内容
ID Start End Count
NC_027757.2 36 41 0
NC_027757.2 71 76 0
NC_027757.2 106 111 0
NC_027757.2 141 146 0
NC_027757.2 183 188 2
NC_027757.2 211 216 7
NC_027757.2 246 251 0
NC_027757.2 281 286 0
NC_027757.2 316 321 0
NC_027757.2 351 356 0
NC_027757.2 386 391 0
NC_027757.2 421 426 0
NC_027757.2 456 461 0
NC_027757.2 491 496 0
NC_027757.2 567 572 3
...............
mitochondrion.txt 内容
NC_027757.2 577 647 fill_color=vlpred
NC_027757.2 648 1601 fill_color=vlppurple
NC_027757.2 1602 1670 fill_color=vlporange
NC_027757.2 1671 3229 fill_color=vlyellow
NC_027757.2 3220 3304 fill_color=vlpred
NC_027757.2 3307 4262 fill_color=vlppurple
NC_027757.2 4263 4331 fill_color=vlporange
NC_027757.2 4402 4469 fill_color=vlyellow
NC_027757.2 4470 5511 fill_color=vlpred
NC_027757.2 5512 5579 fill_color=vlppurple
NC_027757.2 5904 7445 fill_color=vlporange
NC_027757.2 7518 7585 fill_color=vlyellow
NC_027757.2 7586 8269 fill_color=vlpred
NC_027757.2 8295 8364 fill_color=vlppurple
NC_027757.2 8366 8572 fill_color=vlporange
NC_027757.2 8527 9207 fill_color=vlyellow
NC_027757.2 9207 9990 fill_color=vlpred
NC_027757.2 9991 10058 fill_color=vlppurple
NC_027757.2 10059 10404 fill_color=vlporange
NC_027757.2 10405 10469 fill_color=vlyellow
NC_027757.2 10470 10766 fill_color=vlpred
NC_027757.2 10760 12137 fill_color=vlppurple
NC_027757.2 12138 12206 fill_color=vlporange
NC_027757.2 12207 12265 fill_color=vlyellow
NC_027757.2 12266 12336 fill_color=vlpred
NC_027757.2 12337 14148 fill_color=vlppurple
NC_027757.2 14747 15887 fill_color=vlporange
NC_027757.2 15883 15953 fill_color=vlyellow
highligt.txt 内容
NC_027757.2 4339 4400 fill_color=vlporange
NC_027757.2 5587 5655 fill_color=vlporange
NC_027757.2 5657 5729 fill_color=vlppurple
NC_027757.2 5761 5826 fill_color=vlporange
NC_027757.2 5827 5891 fill_color=vlpurple
NC_027757.2 7446 7514 fill_color=vlporange
NC_027757.2 14149 14673 fill_color=vlppurple
NC_027757.2 14674 14742 fill_color=vlporange
NC_027757.2 15956 16023 fill_color=vlppurple
19-14plusminus.depth.txt 内容
ID Start End Count
NC_027757.2 0 10 3276.399902
NC_027757.2 10 20 4897.100098
NC_027757.2 20 30 6683.700195
NC_027757.2 30 40 9275.700195
NC_027757.2 40 50 13224.40039
NC_027757.2 50 60 14929.7002
NC_027757.2 60 70 17682.69922
NC_027757.2 70 80 19832
NC_027757.2 80 90 20589.80078
NC_027757.2 90 100 20817.90039
NC_027757.2 100 110 21192.30078
NC_027757.2 110 120 21874.40039
NC_027757.2 120 130 22982
NC_027757.2 130 140 23440.5
................
mitochondrion_minus_polya.txt 内容
ID Start End Count
NC_027757.2 16551 16546 7
NC_027757.2 16522 16517 3
NC_027757.2 16488 16483 2
NC_027757.2 16461 16456 3
NC_027757.2 16417 16412 3
NC_027757.2 16394 16389 0
NC_027757.2 16347 16342 2
NC_027757.2 16324 16319 0
NC_027757.2 16289 16284 0
NC_027757.2 16254 16249 0
NC_027757.2 16219 16214 0
NC_027757.2 16184 16179 0
NC_027757.2 16149 16144 0
NC_027757.2 16110 16105 1
NC_027757.2 16062 16057 12