bed文件格式解读

2023-06-02 14:04:01 买帖  | 投诉/举报

篇首语:本文由小编为大家整理,主要介绍了bed文件格式解读相关的知识,希望对你有一定的参考价值。

1)BED文件

 BED 文件(Browser Extensible Data)格式是ucsc 的genome browser的一个格式 ,提供了一种灵活的方式来定义的数据行,以用来描述注释信息。BED行有3个必须的列和9个额外可选的列。每行的数据格式要求一致(见下图)。 每条线的字段数目必须是任意单条数据的在注释上一致。

 BED文件结构:
-------------------------------------------------------------必须有以下3列------------------------------------------------------------------------
    chrom :即染色体号
    chromStart :即feature在染色体上起始位置 。在染色体上最左端坐标是0
    chromEnd :即feature在染色体上的终止位置。例如一个染色体前100个碱基定义为chromStart=0,  chromEnd=100, 跨度为 0-99.
----------------------------------------------------------------可选9列-------------------------------------------------------------------------------
    name :feature的名字 ,在基因组浏览器左边显示;
    score :在基因组浏览器中显示的灰度设定,值介于0-1000;

  
    strand :定义链的方向,""+” 或者”-”
    thickStart :起始位置(例如,基因起始编码位置)
    thickEnd :终止位置(例如:基因终止编码位置) 
    itemRGB :是一个RGB值的形式, R, G, B (eg. 255, 0,0), 如果itemRgb设置为"On”, 这个RBG值将决定数据的显示的颜色。
    blockCount :BED行中的block数目,也就是外显子数目
    blockSize:用逗号分割的外显子的大小, 这个item的数目对应于BlockCount的数目
    blockStarts :用逗号分割的列表, 所有外显子的起始位置,数目也与blockCount数目对应

2)和gff之间的关系


   

4) 参考资源

https://en.wikipedia.org/wiki/BED_file_format
   

 

















以上是关于bed文件格式解读的主要内容,如果未能解决你的问题,请参考以下文章