什么是目标检测
在开始后面内容前,我们先来了解下到底什么是目标检测。看看自己对这个领域是否感兴趣,是否满足你的应用要求。
所谓的目标检测,就是我们希望计算机在图像或者视频定位并识别我们感兴趣的目标。
这句话中,核心是 定位感兴趣的目标 和 识别感兴趣的目标。
我们以这个图为例,如果我们现在的任务是找到图片中的 狗 和 汽车。

那么此时,我们 感兴趣的目标是 狗 和 汽车。
定位感兴趣的目标 就是在图像中找到感兴趣目标的位置。在目标检测中,我们通常会使用 边界框 来表示目标的位置。
就是用一个矩形框,框住目标的位置。

而 识别感兴趣的目标,是在定位出来的区域,进一步看看定位区域里面是什么东西,得看看这个是狗还是汽车。
比如最后识别出来左下角矩阵框中的内容是狗,右上角矩阵框中的内容是汽车。

至此,一个目标检测任务就完成了。目标检测模型根据我们设置的感兴趣的目标,在图像中找到目标的位置,并识别出目标的类别。
定位感兴趣的目标 和 识别感兴趣的目标 是比较好理解的,也是目标检测任务的核心。
接下来,我们来聊聊 感兴趣目标 这个相对来说比较抽象的概念。
感兴趣目标,是说我们希望目标检测模型能够 定位并识别出 我们感兴趣的目标。
比如说,我想让目标检测模型定位并识别出图片中的汽车,那汽车就是我们指定的感兴趣的目标。
但大家注意,其中的目标不仅可以是我们日常生活中常见的目标,比如汽车,行人,树木等。还可以是一些 非常规,比较抽象的目标。比如说道路上的裂痕,它也可以看作是目标。
如果把道路上的裂痕作为目标,那么这个目标检测任务就可以用来辅助检测道路是否存在安全隐患。
如果我们把每个文字都当作一个种类的目标,那么这个目标检测任务就可以用来做文字检测,就相当于我们在某信上的对图片进行文字提取功能。
如果感兴趣的目标是人脸,那么目标检测是不是就是大家熟悉的人脸检测。
那这样,我们可以让计算机来检测道路上的裂痕。
总而言之,感兴趣目标 是根据任务需求来定义的,同时不要把目标局限于常规的事物,也可以是一些非常规的事物。
相关资源
在这个教程中,相关的资源有:
- 视频教程。
- 代码。
- 教程文档。
- 自己的数据集。