论文学习笔记:Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regressi 青旅半醒 2021-12-20 11:17 170阅读 0赞 # Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regression # 作者:Hamid Rezatofighi, Nathan Tsoi, JunYoung Gwak, Amir Sadeghian, Ian Reid, Silvio Savarese 论文链接:[https://arxiv.org/abs/1902.09630][https_arxiv.org_abs_1902.09630] 论文解读:[https://mp.weixin.qq.com/s/6QsyYtEVjavoLfU\_lQF1pw][https_mp.weixin.qq.com_s_6QsyYtEVjavoLfU_lQF1pw] # 重点:包围框boundingbox优化方法 # ## 1、零碎的笔记 ## 我首先看的是论文解读连接里面的讲解,截图来自极市平台的解读。 1)bounding box regression中L1、L2 loss这个可以提升的点。 2)IoU是目标检测中一个重要的概念,在anchor-based的方法中,他的作用不仅用来确定正样本和负样本,还可以用来评价输出框(predict box)和ground-truth的距离,或者说predict box的准确性。IoU有一个好的特性就是对尺度不敏感(scale invariant)。 3)loss和IoU对比 ![watermark_type_ZmFuZ3poZW5naGVpdGk_shadow_10_text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L0RpYW5hX1o_size_16_color_FFFFFF_t_70][] 4)IoU也有问题,所以要用GIou ![watermark_type_ZmFuZ3poZW5naGVpdGk_shadow_10_text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L0RpYW5hX1o_size_16_color_FFFFFF_t_70 1][] 5)GIoU ![20190628153751855.png][] **疑问:**这里不是很看得懂![20190628155450147.png][]是什么意思,上下约分一下不就变成了,1/|AUB|了吗。 而且不是很董C是什么,smallest enclosing convex object,最小封闭凸体。 6)GIoU和IoU作为loss的计算方法 ![watermark_type_ZmFuZ3poZW5naGVpdGk_shadow_10_text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L0RpYW5hX1o_size_16_color_FFFFFF_t_70 2][] **上一个疑问在这里找到了答案:** 从这个算法我们回看上面的GIoU截图,最后的![20190628155428651.png][]使用不太准确,应该是|C-(AUB)|/|C| 然后C这个最小封闭凸体,就是最小外切矩形,解读里面将之翻译成最小闭包区域 这个闭包虽然在这个代码里面,因为用的是矩形的boundingbox,所以是最小外切矩形 考虑引申,使用在多边形的mask计算中的时候,应该使用凸包来计算。 7)实验效果 ![20190628160525940.png][] 纵向的MSE是YOLO的原始loss,然后对比LIOU和LGIOU,三行是三个loss比较 AP是Average Precision,目标检测(Object Detection)中性能衡量指标 参考:[https://blog.csdn.net/asasasaababab/article/details/79994920][https_blog.csdn.net_asasasaababab_article_details_79994920] [https_arxiv.org_abs_1902.09630]: https://arxiv.org/abs/1902.09630 [https_mp.weixin.qq.com_s_6QsyYtEVjavoLfU_lQF1pw]: https://mp.weixin.qq.com/s/6QsyYtEVjavoLfU_lQF1pw [watermark_type_ZmFuZ3poZW5naGVpdGk_shadow_10_text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L0RpYW5hX1o_size_16_color_FFFFFF_t_70]: /images/20211220/c2a0805fe4524291bcd0579fad0c832c.png [watermark_type_ZmFuZ3poZW5naGVpdGk_shadow_10_text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L0RpYW5hX1o_size_16_color_FFFFFF_t_70 1]: /images/20211220/c1786dd4b9e44aa1b971e8ee7b1b1d04.png [20190628153751855.png]: /images/20211220/fe86736958b84a7584a77a6ab2b124cc.png [20190628155450147.png]: /images/20211220/1dba9cd77c5245f9850757de950cb1f4.png [watermark_type_ZmFuZ3poZW5naGVpdGk_shadow_10_text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L0RpYW5hX1o_size_16_color_FFFFFF_t_70 2]: /images/20211220/927843d25f6242baa9453860416fedc2.png [20190628155428651.png]: /images/20211220/8d553129787347e4b8ed08558e1a051c.png [20190628160525940.png]: /images/20211220/8a0676f4d8ce4891b9637a884e024065.png [https_blog.csdn.net_asasasaababab_article_details_79994920]: https://blog.csdn.net/asasasaababab/article/details/79994920
还没有评论,来说两句吧...