tensorflow版本CTPN代码阅读

一、roidb

roidb是一个list,里面包含了很多roi(一张图片的信息)。roi是dict类型,一张图片的信息

1.1 roi初始的key

  • boxes: 所有的fine-scale proposal的x1,y1,x2,y2
    • 1000* 4. 假设有1000个proposal
  • gt_classes: 类别, 其实是恒为1
    • 1000*1
  • gt_ishard: 都是0
    • 1000*1
  • gt_overlaps: 相当于onehot编码的ground truth
    • 1000*2
  • flipped: False
    • 标量
  • seg_areas: proposal的面积
    • 1000*1

1.2 roi在prepare_roidb时,又添加的key

  • image: 图片的完整路径
  • width:图片的宽度
  • height:图片的高度
  • max_classes:每个fine-scale proposal的类别编号
    • 1000*1
  • max_overlaps: 全是1
    • 1000*1

你可能感兴趣的:(CTPN)