目录

第一章 前言
          1.1 背景及研究意义
          1.2 研究方法
                  1.2.1 传统的物体检测方法
                   1.2.2 基于深度学习的物体检测方法
第二章 RCNN 系列算法设计与实现
           2.1 RCNN
                   2.1.1 RCNN 流程步骤
                   2.1.2 RCNN 的模型设计          
                   2.1.2 RCNN 的模型设计          
           2.2 SPP-net
                    2.2.1 SPP-net 模型设计
           2.3 Fast R-CNN
                    2.3.1 Fast R-CNN 流程步骤
                    2.3.2 Fast R-CNN 的模型设计
           2.4 Faster R-CNN
                    2.4.1 Faster R-CNN 的流程步骤
                    2.4.2 Faster R-CNN 的模型设计
                    2.4.3 Faster R-CNN 模型训练
第三章 YOLO系列算法设计与实现
            3.1 YOLO v1
                     3.1.1 YOLO 的流程步骤
                     3.1.2 YOLO 的模型设计
            3.2 YOLO v2
                     3.2.1 YOLO v2 的模型设计
                     3.2.2 YOLO v2 模型训练
                     3.2.3 YOLO v2 训练结果
            3.3 YOLO v3
                     3.3.1 YOLO v3 的模型设计
第四章 SSD 算法设计与实现
            4.1 SSD 的流程步骤
            4.2 SSD 的模型设计
                     4.2.1 Multi-scale feature maps
                     4.2.2 SSD loss function
                     4.2.3 生成 default box
            4.3 SSD 模型训练
                     4.3.1 SSD 的训练
                     4.3.2 SSD 训练结果
第五章 Faster R-CNN v.s. YOLO v2 v.s. SSD300
第六章 总结与展望
参考文献
致谢                    
            

                                第一章 前言

            图像检测(Object Detection)是什么?简而言之,就是一个物体 where and what 的判断问题。我们要在图片中找到该物体在哪,即物体的定位(where), 以及还要判断出该类物体具体是什么, 即物体的类别(what).
            对于人类而言,这是个非常简单的问题,可谓是不费吹灰之力的事,随便扫一眼,便可以知道什么物体无什么方位上。但是对于计算机而言,这却是完全不一样的问题了,而且是个相当有难度的问题。对于计算机而言,信息都是以数字的形式存储的,一张彩色的图片,计算机所知道的便只是3个 channel RGB 的 0 ~ 255 的矩阵。当然,这些数字的背后仍是有着一般行的规律的,比如连续的颜色区域或是连续着的同一纹理,数字的空间联系仍是紧密相关的,而正是由于这些联系,使得物体检测算法成为可能,通过算法去寻找图片背后的数字空间,寻找出各物体的数字的空间分布模式。