(转帖)-circos-RCircos

原文地址:https://mp.weixin.qq.com/s/QMYRoYktlu0bUTsUCsM4Fg


install.packages('RCircos')

library(RCircos)

如果你安装好了,就直接加载它们即可

library(RCircos)

最基本的circos图

最基本的图,就是直接利用物种的染色体信息,展示出来即可

#导入内建人类染色体数据

data(UCSC.HG38.Human.CytoBandIdeogram)

cyto.info<-UCSC.HG38.Human.CytoBandIdeogram

RCircos.Set.Core.Components(cyto.info,chr.exclude=NULL,tracks.inside=10,tracks.outside=0)

##

## RCircos.Core.Components initialized.

## Type ?RCircos.Reset.Plot.Parameters to see how to modify the core components.

#chr.exclude <- NULL;           设置不显示的染色体,如 c(1,3)

#cyto.info <- UCSC.HG19.Human.CytoBandIdeogram; 设置染色体数据

#tracks.inside <- 10;    设置内部track 个数

#tracks.outside <- 0;    设置外部track 个数

RCircos.Set.Plot.Area()RCircos.Chromosome.Ideogram.Plot()

#绘制染色体表意文字,染色体的默认方法亮点和染色体名称。

(转帖)-circos-RCircos_第1张图片

复杂化

在前面最基本的图的基础上面把circos复杂化,一步步添加到我们想要的信息。 ### 基础染色体信息 同上

#导入内建人类染色体数据a<-function(...){

data(UCSC.HG19.Human.CytoBandIdeogram);

head(UCSC.HG19.Human.CytoBandIdeogram);

## 这里换了个参考基因组版本,请注意chr.exclude<-NULL;#设置不显示的染色体,如 c(1,3)          cyto.info<-UCSC.HG19.Human.CytoBandIdeogram;#设置染色体数据tracks.inside<-10;#设置内部track 个数tracks.outside<-0;#设置外部track 个数#导入上面四个基本参数RCircos.Set.Core.Components(cyto.info,chr.exclude,tracks.inside,tracks.outside);

RCircos.Set.Plot.Area()

RCircos.Chromosome.Ideogram.Plot()}a()

(转帖)-circos-RCircos_第2张图片

#绘制染色体表意文字,染色体的默认方法亮点和染色体名称。

在基因组上面根据坐标标记基因

前面已经介绍过这个RCircos.Gene.Label.Data数据是什么了

b<-function(...){a()#Gene Labels and connectors on RCircos Plot#RCircos.Gene.Connector.Plot   绘制染色体表意文字和基因名称之间的连接#RCircos.Gene.Name.Plot 在数据轨道上绘制基因名称data(RCircos.Gene.Label.Data);

name.col<-4;

side<-"in";

track.num<-1;RCircos.Gene.Connector.Plot(RCircos.Gene.Label.Data,track.num,side);

track.num<-2;

RCircos.Gene.Name.Plot(RCircos.Gene.Label.Data,name.col,track.num,side);}

b()


用热图来标记基因组每个区域的数据

一般是拷贝数变异等数据,用RCircos.Heatmap.Plot函数绘制一个数据轨道的热图

data(RCircos.Heatmap.Data);head(RCircos.Heatmap.Data);

##   Chromosome chromStart chromEnd GeneName  X786.O     A498 A549.ATCC

## 1       chr1     934341   935552     HES4 6.75781  7.38773   6.47890

## 2       chr1     948846   949919    ISG15 7.56297 10.49590   5.89893

## 3       chr1    1138887  1142089 TNFRSF18 4.69775  4.55593   4.38970

## 4       chr1    1270657  1284492     DVL1 7.76886  7.52194   6.87125

## 5       chr1    1288070  1293915    MXRA8 4.49805  4.72032   4.62207

## 6       chr1    1592938  1624243 SLC35E2B 8.73104  8.10229   8.36599

##      ACHN   BT.549  CAKI.1

## 1 6.05517  8.85062 7.00307

## 2 7.58095 12.08470 7.81459

## 3 4.50064  4.47525 4.47721

## 4 7.03517  7.65386 7.69733

## 5 4.58575  5.66389 4.93499

## 6 9.04116  9.24175 9.89727

c<-function(...){b()data.col<-6;track.num<-5;side<-"in";RCircos.Heatmap.Plot(RCircos.Heatmap.Data,data.col,track.num,side);}c()


加上散点图

用RCircos.Scatter.Plot函数来添加一个数据轨迹的扫描图

data(RCircos.Scatter.Data);head(RCircos.Scatter.Data);

##   chromosome   start     stop num.mark seg.mean

## 1          1   61735   228706       18  -0.4459

## 2          1  228729   356443       10   0.5624

## 3          1  356542   564621        4  -0.9035

## 4          1  603590  1704138      227   0.3545

## 5          1 1709023  1711414        6   1.2565

## 6          1 1714558 12862252     6276   0.4027

d<-function(...){c()RCircos.Scatter.Data$chromosome=paste0('chr',RCircos.Scatter.Data$chromosome)head(RCircos.Scatter.Data);data.col<-5;track.num<-6;side<-"in";by.fold<-1;RCircos.Scatter.Plot(RCircos.Scatter.Data,data.col,track.num,side,by.fold);}d()

> 这个数据里面的染色体号码起初并没有加上’chr’,我做了个修改


加上直线

用RCircos.Line.Plot函数绘制线为一个数据轨道

data(RCircos.Line.Data);head(RCircos.Line.Data);

##   chromosome    start     stop num.mark seg.mean

## 1          1    61735 16895627     8732   0.1797

## 2          1 16896821 17212714      105  -0.2117

## 3          1 17214822 25574471     5321   0.1751

## 4          1 25574707 25662212       37   0.5064

## 5          1 25663310 30741496     2400   0.1384

## 6          1 30741656 30745210        3  -1.4742

e<-function(...){d()RCircos.Line.Data$chromosome=paste0('chr',RCircos.Line.Data$chromosome)head(RCircos.Line.Data);data.col<-5;track.num<-7;side<-"in";RCircos.Line.Plot(RCircos.Line.Data,data.col,track.num,side);}e()


加上直方图

这里用RCircos.Histogram.Plot 函数绘制一个数据轨迹的直方图

data(RCircos.Histogram.Data);head(RCircos.Histogram.Data);

##   Chromosome chromStart chromEnd     Data

## 1       chr1   45000000 49999999 0.070859

## 2       chr1   55000000 59999999 0.300460

## 3       chr1   60000000 64999999 0.125421

## 4       chr1   70000000 74999999 0.158156

## 5       chr1   75000000 79999999 0.163540

## 6       chr1   80000000 84999999 0.342921

f<-function(...){e()data.col<-4;track.num<-8;side<-"in";RCircos.Histogram.Plot(RCircos.Histogram.Data,data.col,track.num,side);}f()


给每个区间加上title

老实说,我觉得这一个圈圈没有必要绘

data(RCircos.Tile.Data);head(RCircos.Tile.Data)

##   Chromosome chromStart  chromEnd

## 1       chr1          0  23900000

## 2       chr1   12700000  44100000

## 3       chr1   28000000  68900000

## 4       chr1   59000000  94700000

## 5       chr1   99700000 120600000

## 6       chr1  147000000 234700000

g<-function(...){f()track.num<-9;side<-"in";RCircos.Tile.Plot(RCircos.Tile.Data,track.num,side);}g()


最后把有连接关系的基因连线

用RCircos.Link.Plot函数绘制两个或多个基因组位置之间的链接线,请自行查看RCircos.Link.Data数据是什么,如何映射到这个circos图上的。

data(RCircos.Link.Data);head(RCircos.Link.Data);

##   Chromosome chromStart  chromEnd Chromosome.1 chromStart.1 chromEnd.1

## 1       chr1    8284703   8285399         chr1      8285752    8286389

## 2       chr1   85980143  85980624         chr7    123161313  123161687

## 3       chr1  118069850 118070319         chr1    118070329  118070689

## 4       chr1  167077258 167077658         chr1    169764630  169764965

## 5       chr1  171671272 171671550         chr1    179790879  179791292

## 6       chr1  174333479 174333875         chr6    101861516  101861840

h<-function(...){g()track.num<-11;RCircos.Link.Plot(RCircos.Link.Data,track.num,TRUE);data(RCircos.Ribbon.Data);RCircos.Ribbon.Plot(ribbon.data=RCircos.Ribbon.Data,track.num=11,by.chromosome=FALSE,twist=FALSE)}h()


保存为PDF

这个需要具体设置,因为circos图占画布跟其它图不太一样

out.file<-"RCircosDemoHumanGenome.pdf";pdf(file=out.file,height=8,width=8,compress=TRUE);RCircos.Set.Plot.Area();par(mai=c(0.25,0.25,0.25,0.25));plot.new();plot.window(c(-2.5,2.5),c(-2.5,2.5));## 把circos图画在这里即可dev.off();

最后给一个sessionInfo()吧

sessionInfo()

## R version 3.3.3 (2017-03-06)

## Platform: x86_64-apple-darwin13.4.0 (64-bit)

## Running under: macOS Sierra 10.12.4

##

## locale:

## [1] C

##

## attached base packages:

## [1] stats     graphics  grDevices utils     datasets  methods   base    

##

## other attached packages:

## [1] RCircos_1.2.0

##

## loaded via a namespace (and not attached):

##  [1] backports_1.0.5 magrittr_1.5    rprojroot_1.2   tools_3.3.3    

##  [5] htmltools_0.3.5 yaml_2.1.14     Rcpp_0.12.10    stringi_1.1.3  

##  [9] rmarkdown_1.4   knitr_1.15.1    stringr_1.2.0   digest_0.6.12  

## [13] evaluate_0.10

看看内置的测试数据

circos

本来是一个perl程序,专门用来genomic features在全基因组的分布,连接的。 所以输入数据必然要包含染色体,起始终止坐标的。

然后可以是一列value用来调色或者高度信息,可以加入基因名字等各种信息。 如果有两个genomic features的坐标信息,就是连接图啦。

下面是几个例子:

data(RCircos.Gene.Label.Data);head(RCircos.Gene.Label.Data);

##   Chromosome chromStart chromEnd   Gene

## 1       chr1    8921418  8934967   ENO1

## 2       chr1   17345375 17380514   SDHB

## 3       chr1   27022894 27107247 ARID1A

## 4       chr1   41976121 42501596 HIVEP3

## 5       chr1   43803519 43818443    MPL

## 6       chr1   45794977 45805926  MUTYH

data(RCircos.Histogram.Data)head(RCircos.Histogram.Data)

##   Chromosome chromStart chromEnd     Data

## 1       chr1   45000000 49999999 0.070859

## 2       chr1   55000000 59999999 0.300460

## 3       chr1   60000000 64999999 0.125421

## 4       chr1   70000000 74999999 0.158156

## 5       chr1   75000000 79999999 0.163540

## 6       chr1   80000000 84999999 0.342921

data(RCircos.Heatmap.Data)head(RCircos.Heatmap.Data)

##   Chromosome chromStart chromEnd GeneName  X786.O     A498 A549.ATCC

## 1       chr1     934341   935552     HES4 6.75781  7.38773   6.47890

## 2       chr1     948846   949919    ISG15 7.56297 10.49590   5.89893

## 3       chr1    1138887  1142089 TNFRSF18 4.69775  4.55593   4.38970

## 4       chr1    1270657  1284492     DVL1 7.76886  7.52194   6.87125

## 5       chr1    1288070  1293915    MXRA8 4.49805  4.72032   4.62207

## 6       chr1    1592938  1624243 SLC35E2B 8.73104  8.10229   8.36599

##      ACHN   BT.549  CAKI.1

## 1 6.05517  8.85062 7.00307

## 2 7.58095 12.08470 7.81459

## 3 4.50064  4.47525 4.47721

## 4 7.03517  7.65386 7.69733

## 5 4.58575  5.66389 4.93499

## 6 9.04116  9.24175 9.89727

data(RCircos.Link.Data)head(RCircos.Link.Data)

##   Chromosome chromStart  chromEnd Chromosome.1 chromStart.1 chromEnd.1

## 1       chr1    8284703   8285399         chr1      8285752    8286389

## 2       chr1   85980143  85980624         chr7    123161313  123161687

## 3       chr1  118069850 118070319         chr1    118070329  118070689

## 4       chr1  167077258 167077658         chr1    169764630  169764965

## 5       chr1  171671272 171671550         chr1    179790879  179791292

## 6       chr1  174333479 174333875         chr6    101861516  101861840

熟悉物种的染色体信息

就是很简单染色体的每个片段的起始终止坐标信息,取决于物种还有它对应的参考基因组版本

data(UCSC.HG19.Human.CytoBandIdeogram);head(UCSC.HG19.Human.CytoBandIdeogram);

##   Chromosome ChromStart ChromEnd   Band  Stain

## 1       chr1          0  2300000 p36.33   gneg

## 2       chr1    2300000  5400000 p36.32 gpos25

## 3       chr1    5400000  7200000 p36.31   gneg

## 4       chr1    7200000  9200000 p36.23 gpos25

## 5       chr1    9200000 12700000 p36.22   gneg

## 6       chr1   12700000 16200000 p36.21 gpos50

data(UCSC.Mouse.GRCm38.CytoBandIdeogram);

head(UCSC.Mouse.GRCm38.CytoBandIdeogram);

##   Chromosome ChromStart ChromEnd Band   Stain

## 1       chr1          0  8840440  qA1 gpos100

## 2       chr1    8840440 12278390  qA2    gneg

## 3       chr1   12278390 20136559  qA3  gpos33

## 4       chr1   20136559 22101102  qA4    gneg

## 5       chr1   22101102 30941543  qA5 gpos100

## 6       chr1   30941543 43219933   qB    gneg

data(UCSC.Baylor.3.4.Rat.cytoBandIdeogram);

head(UCSC.Baylor.3.4.Rat.cytoBandIdeogram);

##   Chromosome ChromStart ChromEnd Band Stain

## 1       chr1          0 10142096  p13  gneg

## 2       chr1   10142096 24272657  p12  gvar

## 3       chr1   24272657 38517175  p11  gneg

## 4       chr1   38517175 48659271  q11  gpos

## 5       chr1   48659271 69741157  q12  gneg

## 6       chr1   69741157 90025350  q21  gpos

参数列表如下;

rcircos.params<-RCircos.Get.Plot.Parameters();

rcircos.cyto<-RCircos.Get.Plot.Ideogram();

rcircos.position<-RCircos.Get.Plot.Positions();

RCircos.List.Plot.Parameters()

## Parameters for current RCircos session.

##

## Parameters in inch:

## ==============================

## radius.len:      1.84

## chr.ideo.pos:        1.94

## highlight.pos:       2.09

## chr.name.pos:        2.14

## plot.radius:     2.64

## track.in.start:      1.89

## track.out.start: 2.49

## chrom.width:     0.1

## track.padding:       0.02

## track.height:        0.1

##

## Parameters in chromosome unit:

## ==============================

## base.per.unit:       30000

## chrom.paddings:      300

## heatmap.width:       100

## hist.width:      100

## gene name char. width:   500

##

## General R graphic parameters:

## ==============================

## text.size:       0.4

## highlight.width: 2

## point.type:      .

## point.size:      1

## text.color:      black

## heatmap.color:       BlueWhiteRed

## hist.color:      red

## line.color:      black

## scatter.color:       black

## tile.color:      black

## track.background:    wheat

## grid.line.color: gray

## Bezier.point:        1000

## max.layers:      5

## sub.tracks:      5

##

## Data track numbers:

## ==============================

## tracks.inside:       10

## tracks.outside:      0

## Following are procedures to change RCircos plot parameters:

## params <- RCircos.Get.Plot.Parameters();

## params$radius.len <- 2.0;

## params$base.per.unit <- 5000;

## RCircos.Reset.Plot.Parameters(params)

##

## Chromosome ideogram data were automatically modified.

可以看出一个circos图由上面3个部分组成,如下:

RCircos cytoband data

RCircos plot positions

RCircos plot parameters(最复杂啦)

每个部分都可以单独调整细节:

params<-RCircos.Get.Plot.Parameters();

#获得参数列表

params$radius.len<-2.0;

#更改其中的参数

params$base.per.unit<-5000;

#更改其中的参数

RCircos.Reset.Plot.Parameters(params)#参数重置

快分享给你的小伙伴吧,免得他/她妈妈担心

你可能感兴趣的:((转帖)-circos-RCircos)