bed文件格式(转自http://blog.sina.com.cn/s/blog_70b2b6020100liou.html)

我们先在最需要的就是前面的三个参数,

第一个,染色体的编号:这个形式根据你的ref文件来确定

然后染色体上的起始位置,将如是5000,那么程序将从5001开始计数。

然后染色体上的终止位置,加入是5500,那么就是截至到5500


BED 文件格式

       BED 文件格式是一个可变方式的数据线,用来描述注释的数据。BED线有3个要求的字段和9个额外的字段。 每条线的字段数目必须是任意单条数据的在注释上一致。可选字段的序试结合低数字的字段必须流行如果高位字段被使用。

首先是三个要求的BED字段

  1. chrom, 染色体或scafflold 的名字(eg chr3, chrY, chr2_random, scaffold0671 )

  2. chromStart 染色体和scaffold的起始位置,第一个染色体的位置是0

  3. chromEn 染色体和scaffold的结束位置,染色体的末端位置没有包含到显示信息里面。例如,首先得100个碱基的染色体定义为chromStart =0 . chromEnd=100, 碱基的数目是0-99

 

     9 个额外的可选BED 字段是:

  4. name 定义BED 的名字

   5. score 01000的分值,如果track线在注释时属性设置为1,那么这个分值会决定现示灰度水平,数字

     越大,灰度越高。下面的这个表格显示Genome Browser

   6. strand 定义链的''+” 或者”-”

   7. thickStart 开始的位置,这个特征是画thickly(例如,在开始的编码显示基因的显示

  8. thickEnd 结束的位置,这个特征是画thickly例如,在结束的编码显示基因的显示 

  9 itemRGB An AGB 值的形式, R, G, B (eg. 255, 0, 0), 如果track line itemRgb属性是设置为'On”, 这个RBG 值将

    决 定数据的显示的颜色在BED 线。 注意, 它推荐简单的颜色方案(eight color or less )是用作这个属性

    避免颜色资源在基因组浏览器上过多

  1. blockCount BED线在exon 的block数目

  2. blockSize 用逗号分割block size, 这个item的列表对应于BlockCount

  3. blockStarts- 用逗号分割的列表, 所有的blockStart位置应该被计算相关于chromStart, 这个数字的项应该对应于blockCount..

 

你可能感兴趣的:(bed文件格式(转自http://blog.sina.com.cn/s/blog_70b2b6020100liou.html))