Programmimg & Me: [筆記]Object Detection的Bounding Box格式

[筆記]Object Detection的Bounding Box格式

markdown

近期在研究 YOLO（You Only Look Once）物件偵測

常常在資料集上遇到各種不同格式要轉換來轉換去

趁這時候筆記一下各種Bounding Box格式(後面簡稱bbox)

免得自己時常忘記

COCO：(X,Y,W,H)
X,Y為bbox的左上角座標，W,H為bbox的寬度與高度

json{
"image_id": 1,
"category_id": 2,
"bbox": [x, y, width, height],
"area": area,
"iscrowd": 0
}
VOC：(X0,Y0,X1,Y1)
X0,Y0為bbox的左上角座標
X1,Y1為bbox的左下角座標

例:
<bndbox>
<xmin>111</xmin>
<ymin>46</ymin>
<xmax>266</xmax>
<ymax>157</ymax>
</bndbox>

YOLO：(Class,X,Y,W,H)
X,Y為bbox的中心點座標與圖片寬高的比值，為中心座標
W,H為bbox的寬度與高度與圖片寬高的比值

例：
1 0.250988 0.721221 0.287746 0.323246

因此若是使用YOLO格式對我幫助應該蠻大的！

下面有關於YOLO的介紹連結⬇︎

YOLO介紹：連結

沒有留言:

張貼留言

訂閱：張貼留言 (Atom)