markdown
近期在研究 YOLO(You Only Look Once)物件偵測
常常在資料集上遇到各種不同格式要轉換來轉換去
趁這時候筆記一下各種Bounding Box格式(後面簡稱bbox)
免得自己時常忘記
- COCO:(X,Y,W,H)
X,Y為bbox的左上角座標,W,H為bbox的寬度與高度
json{
"image_id": 1,
"category_id": 2,
"bbox": [x, y, width, height],
"area": area,
"iscrowd": 0
} - VOC:(X0,Y0,X1,Y1)
X0,Y0為bbox的左上角座標
X1,Y1為bbox的左下角座標
例:
<bndbox>
<xmin>111</xmin>
<ymin>46</ymin>
<xmax>266</xmax>
<ymax>157</ymax>
</bndbox>
- YOLO:(Class,X,Y,W,H)
X,Y為bbox的中心點座標與圖片寬高的比值,為中心座標
W,H為bbox的寬度與高度與圖片寬高的比值
例:
1 0.250988 0.721221 0.287746 0.323246
因此若是使用YOLO格式對我幫助應該蠻大的!
下面有關於YOLO的介紹連結⬇︎
YOLO介紹:連結
沒有留言:
張貼留言