跳到主要内容

什么是目标检测

在开始后面内容前,我们先来了解下到底什么是目标检测。看看自己对这个领域是否感兴趣,是否满足你的应用要求。

所谓的目标检测,就是我们希望计算机在图像或者视频定位并识别我们感兴趣的目标。

这句话中,核心是 定位感兴趣的目标识别感兴趣的目标

我们以这个图为例,如果我们现在的任务是找到图片中的 汽车

那么此时,我们 感兴趣的目标汽车

定位感兴趣的目标 就是在图像中找到感兴趣目标的位置。在目标检测中,我们通常会使用 边界框 来表示目标的位置。

就是用一个矩形框,框住目标的位置。

识别感兴趣的目标,是在定位出来的区域,进一步看看定位区域里面是什么东西,得看看这个是还是汽车

比如最后识别出来左下角矩阵框中的内容是,右上角矩阵框中的内容是汽车

至此,一个目标检测任务就完成了。目标检测模型根据我们设置的感兴趣的目标,在图像中找到目标的位置,并识别出目标的类别。

定位感兴趣的目标识别感兴趣的目标 是比较好理解的,也是目标检测任务的核心。

接下来,我们来聊聊 感兴趣目标 这个相对来说比较抽象的概念。

感兴趣目标,是说我们希望目标检测模型能够 定位并识别出 我们感兴趣的目标。

比如说,我想让目标检测模型定位并识别出图片中的汽车,那汽车就是我们指定的感兴趣的目标。

但大家注意,其中的目标不仅可以是我们日常生活中常见的目标,比如汽车,行人,树木等。还可以是一些 非常规,比较抽象的目标。比如说道路上的裂痕,它也可以看作是目标。

如果把道路上的裂痕作为目标,那么这个目标检测任务就可以用来辅助检测道路是否存在安全隐患。

如果我们把每个文字都当作一个种类的目标,那么这个目标检测任务就可以用来做文字检测,就相当于我们在某信上的对图片进行文字提取功能。

如果感兴趣的目标是人脸,那么目标检测是不是就是大家熟悉的人脸检测。

那这样,我们可以让计算机来检测道路上的裂痕。

总而言之,感兴趣目标 是根据任务需求来定义的,同时不要把目标局限于常规的事物,也可以是一些非常规的事物。

相关资源

在这个教程中,相关的资源有:

  1. 视频教程。
  2. 代码。
  3. 教程文档。
  4. 自己的数据集。