0

点赞

收藏

分享

037、目标检测-算法速览

kolibreath 2023-11-20 阅读 50

标签: 目标检测人工智能计算机视觉

之——常用算法速览

目录

之——常用算法速览

1.区域卷积神经网络 - R-CNN

2.单发多框检测SSD，single shot detection

杂谈

快速过一下目标检测的各类算法。

正文

1.区域卷积神经网络 - R-CNN

region_based CNN，奠基性的工作。

选择锚框是一个较为复杂的算法，来自于神经网络还没发展的时候；启发式算法选择出锚框后，每一个锚框当做一个图片，然后用预训练好的CNN抽取特征；然后训练SVM用来分类，训练一个回归模型来预测边缘框，具体是：

然而锚框的选择大小与比例是不一定的，这种情况下如何生成规则的训练batch呢，于是提出了RoI(region of interest)，兴趣区域池化：

这个方法不会严格均匀地切割，而是会尽量按比例切割满足最后输出，看对应颜色：

Fast RCNN：

对于RCNN的加强，主要的改进是直接对整张图片抽特征而不是对锚框抽特征：

搜到锚框之后再映射到CNN之后的feature map上：

再把特征图上的ROI展平投入到全连接层进行预测。

Faster R-CNN:

更进一步的改进是：

二分类预测锚框合理与不合理：

Mask R-CNN:

如果有像素级别的标号就用FCN来处理，提升原有的性能；roi pooling改为了roi align以避免像素级的误差：

比较贵，实用性不高：

2.单发多框检测SSD，single shot detection

单发步枪，只跑一遍，不需要两个网络。

生成锚框的办法：

然后的操作：

多个分辨率下去锚框然后用算法预测类别和边界框，参考上面RCNN的预测方法。

性能，更快但没那么准：

主要原因应该是没有什么改进？

3.yolo

you only live once：

you only look once：

每个锚框预测了多个边缘框，因为这样均匀分割的锚框可能会同时挨到多个真实边缘框。

后续通过细节改进进行提升，比如引入数据集真实框的先验知识之类的。

0 条评论

关注