什么是目标检测

在开始后面内容前，我们先来了解下到底什么是目标检测。看看自己对这个领域是否感兴趣，是否满足你的应用要求。

所谓的目标检测，就是我们希望计算机在图像或者视频定位并识别我们感兴趣的目标。

这句话中，核心是 定位感兴趣的目标 和 识别感兴趣的目标。

我们以这个图为例，如果我们现在的任务是找到图片中的 狗 和 汽车。

那么此时，我们 感兴趣的目标是 狗 和 汽车。

定位感兴趣的目标 就是在图像中找到感兴趣目标的位置。在目标检测中，我们通常会使用 边界框 来表示目标的位置。

就是用一个矩形框，框住目标的位置。

而 识别感兴趣的目标，是在定位出来的区域，进一步看看定位区域里面是什么东西，得看看这个是狗还是汽车。

比如最后识别出来左下角矩阵框中的内容是狗，右上角矩阵框中的内容是汽车。

至此，一个目标检测任务就完成了。目标检测模型根据我们设置的感兴趣的目标，在图像中找到目标的位置，并识别出目标的类别。

定位感兴趣的目标 和 识别感兴趣的目标 是比较好理解的，也是目标检测任务的核心。

接下来，我们来聊聊 感兴趣目标 这个相对来说比较抽象的概念。

感兴趣目标，是说我们希望目标检测模型能够定位并识别出我们感兴趣的目标。

比如说，我想让目标检测模型定位并识别出图片中的汽车，那汽车就是我们指定的感兴趣的目标。

但大家注意，其中的目标不仅可以是我们日常生活中常见的目标，比如汽车，行人，树木等。还可以是一些 非常规，比较抽象的目标。比如说道路上的裂痕，它也可以看作是目标。

如果把道路上的裂痕作为目标，那么这个目标检测任务就可以用来辅助检测道路是否存在安全隐患。

如果我们把每个文字都当作一个种类的目标，那么这个目标检测任务就可以用来做文字检测，就相当于我们在某信上的对图片进行文字提取功能。

如果感兴趣的目标是人脸，那么目标检测是不是就是大家熟悉的人脸检测。

那这样，我们可以让计算机来检测道路上的裂痕。

总而言之，感兴趣目标 是根据任务需求来定义的，同时不要把目标局限于常规的事物，也可以是一些非常规的事物。

相关资源​