[筆記]Object Detection的Bounding Box格式

markdown 

近期在研究 YOLO(You Only Look Once)物件偵測

常常在資料集上遇到各種不同格式要轉換來轉換去

趁這時候筆記一下各種Bounding Box格式(後面簡稱bbox)

免得自己時常忘記


  • COCO:(X,Y,W,H)
    X,Y為bbox的左上角座標,W,H為bbox的寬度與高度


    json{
     "image_id": 1,
     "category_id": 2,
     "bbox": [x, y, width, height],
     "area": area,
     "iscrowd": 0
     }


  • VOC:(X0,Y0,X1,Y1)
    X0,Y0為bbox的左上角座標
    X1,Y1為bbox的左下角座標

    例:
    <bndbox>
       <xmin>111</xmin>
       <ymin>46</ymin>
       <xmax>266</xmax>
       <ymax>157</ymax>
    </bndbox>

  • YOLO:(Class,X,Y,W,H)
    X,Y為bbox的中心點座標與圖片寬高的比值,為中心座標
    W,H為bbox的寬度與高度與圖片寬高的比值

    例:
    1 0.250988 0.721221 0.287746 0.323246




因此若是使用YOLO格式對我幫助應該蠻大的!


下面有關於YOLO的介紹連結⬇︎

YOLO介紹:連結


沒有留言:

張貼留言

[筆記]Object Detection的Bounding Box格式

markdown  近期在研究  YOLO(You Only Look Once) 物件偵測