图像处理之目标检测入门总结

发布时间：2022-08-19 13:09

点击上方“小白学视觉”，选择加"星标"或“置顶”

重磅干货，第一时间送达

本文转自|机器学习算法那些事

本文首先介绍目标检测的任务，然后介绍主流的目标检测算法或框架，重点为Faster R-CNN，SSD，YOLO三个检测框架。本文内容主要整理自网络博客，用于普及性了解。

ps：由于之后可能会有一系列对象检测的论文阅读笔记，在论文阅读之前，先大致了解一下目前的研究现状，目标检测的各种主流方法的大致原理，以助于后面能更顺畅看懂论文，后续再通过论文阅读进行细节学习。由于尚未阅读相关论文原文，若有问题，欢迎指出！先献上一个RCNN系列的图（来自知乎：iker peng）。

Objection Detection Tasks

目前计算机视觉（CV，computer vision）与自然语言处理（Natural Language Process， NLP）及语音识别（Speech Recognition）并列为人工智能（AI，artificial intelligence）·机器学习（ML，machine learning）·深度学习（DL，deep learning）方向的三大热点方向。

而计算机视觉又有四个基本任务（关于这个任务，说法不一，比如有些地方说到对象检测detection、对象追踪tracking、对象分割segmentation，不用拘泥），即图像分类，对象定位及检测，语义分割，实例分割。图示如下：

a)图像分类：一张图像中是否包含某种物体
b)物体检测识别：若细分该任务可得到两个子任务，即目标检测，与目标识别，首先检测是视觉感知得第一步，它尽可能搜索出图像中某一块存在目标（形状、位置）。而目标识别类似于图像分类，用于判决当前找到得图像块得目标具体是什么类别。
c)语义分割：按对象得内容进行图像得分割，分割的依据是内容，即对象类别。
d)实例分割：按对象个体进行分割，分割的依据是单个目标。

图像处理之目标检测入门总结

Objection Detection Tasks

相关推荐