实时的基于机器学习的检测图像的车的快速训练

实时的基于机器学习的检测图像的车的快速训练

米洛斯Stojmenovic

收到：2005 / 23十一月接受：2006日28 /发表于：30 2006

施普林格出版社2006

[摘要]我们的主要兴趣是建立快速基于小图像可靠的目标识别ING集需要构建大多是手动的，如我们研究的本田雅阁，识别2004从后方的看法。我们描述了一种新的变种基于AdaBoost的学习算法，建立了一个强分类器的弱分类增量—sifiers（WCS），最小的组合误差已选定的厕所。每个WC训练只有一次，例子并不改变它们的权重。我们描述一组为考虑适当类型的特征识别问题，包括发红措施和占主导地位的边缘取向。现有的边缘定位—水平（垂直，分别）边缘属于同一仓。我们提出了预先消除功能的最佳的阈值附近的迷你琐碎的位置—所有的妈妈或最大值。这是一个新的的方法，减少了训练集WC的数量不到原来的10%，大大加快—建立培训时间，并没有负面影响最终的分类器的质量。我们还修改了实验。表明，Viola和琼斯使用的功能集人脸识别是低效的和别人对我们的的问题，准确和实时识别的汽车快速训练。我们的培训方法，找到一个非常准确的分类只含有30厕所后1h训练。与现有的文献相比，我们的整体实现一个真正的设计用最少的时间目标检测机的例子，厕所数量最少的，最快的训练时间，具有竞争力的检测和假阳性率。

1引言

本文的目的是分析能力—在当前的机器学习技术，解决“能力”，我们的意思是实时性，较高的检测率，假阳性率低，快速的训练和学习用在训练集是不容易的，和最它需要手动创建。

我们将应用机器学习的检测具体地说，能够认识到某种类型的如本田汽车协议，2004。因此，应该是一个任意的输入图像，和的结果应该是相同的图像一个矩形的发生在我们的车寻找。此外，检测精度，其第二个主要的目的是实时性能。Pro—克应迅速找到给定类型的所有汽车位置在图像中，在相同的方式和琼斯认为所有的头。定义房我们想得到一个回答测试图像在第二个左右的响应时间取决于。的测试图像的大小，因此似乎是真实的对于较小的图像的时间可能不那么大的。

最后，我们的目标是设计对象检测—基于一个小数量的培训考试系统样品。我们设想在训练的例子是不容易获得的情况下的应用。例如，在的情况下，我们的研究，我们必须采取的照片几百个本田协定和其他汽车的看法创建训练集，因为几乎没有正面的形象在网上找到的。在这种情况下，它是很难的希望能有数万成千上万的图像现成的，这是人脸检测的情况—问题。一个小的额外训练集，训练时间减少。这使我们进行了大量的尝试训练，调整设置例子，调整设置的功能，不同的测试集弱分类器（WCS），否则分析通过观察生成的类的行为过程。由于与一个小数量的训练的成功的例子是不清楚的，我们还必须设置快速列车—进行了一些调整和改进系统。本文的两个主要的贡献，预—为满足所有目标。我们将在一个机器学习的方法试图解决的问题检测出来特殊的车型自他们似乎是适当的鉴于问题的设置。机器学习相似图像检索已被证明是可靠的坐—评估的目标对象不改变方向，一个经典的应用已成为检测直立向前头所提出的中提琴琼斯。汽车通常是在相同的发现相对于道路的方向。他们可以照片—（正面，侧面……）但其实很少发现了边。我们是国际形势莎莉在车辆的后部。这也是目标对警察的交通监控设备的选择，因为他们的相机的位置通常是电影的许可证用于车辆识别的目的板。那里—前，硬件已经到位，各种软件在车辆检测中的应用。

积极的图像采取的，所有本田有相同的一般正交方相对于相机。一些偏差的发生在球场上，这些图像，偏航和滚动，这可能可为什么产生的检测器具有如此广泛的有效性。这是建立机器是有效的在角以下偏差：−15◦，偏航−30◦30◦，卷15至18。这意味着图片本田从角度是由规定的的数量依然由程序检测。算法用于目标检测问题。实验结果给出了。4。结论会议，只讨论版在我们的汽车检测系统的功能设置。任何特定类型的车后视图。因此我们回顾了解决更一般的问题。存在—ING的车辆检测系统，如那些尝试自动驾驶汽车沿公路实际上不检测道路上的汽车。他们只是认为任何—事情正在高速公路上的车辆。在科学文献，一些汽车识别方案的存在是基于形状的探测器。现有的基于形状的方法报道已匹配A60–85%提高。基于最近邻匹配的方法对视角变化过于敏感，而方法基于PCA（主成分分析）不一个实时系统。目标检测的最普遍的例子是人脸检测。基本应用为中提琴和琼斯的实时人脸识别系统。

是具体的机器学习方法由Viola和琼斯用来实现他们的系统。在这种方法中，正和负的训练集通过级联分类器分开，每个构造采用AdaBoost。实时性能的实现（一个预处理步骤后）。的训练时间人脸检测器，似乎是缓慢的，甚至用了几个月根据一些报道。Viola和Joss的脸，发现系统已经证实在文献中的一些文章。修正—阳离子包括新功能的添加。特别的，和那些基于一个特定部分的颜色图像。机器本身的修改在几个方面的文献。我们已经考虑到了所有的在文献提出的修改，并通过思想被认为是有助于实现我们的目标。

我们再次强调，最成功的应用:使用一个大的训练集。在中提琴琼斯的原始的人脸检测器，图像用于训练集。已知的最小的训练他们开始在90%只猫实现的检出率—类型时正例数reached250。负的实例数是未指定在这个阶段，但作者说，他们随机10000图像从互联网下载包含100000000子窗口。他们只是适度增加了检测的阳性率的大小将大幅增长的对象。的大小等于或大于24×24像素（用于面搜索），（我们有车限100×150搜索）作为输入，并宣布是否这个地区包含搜索的对象。我们用这样的机器整个图像分析。我们通过每个子窗口包含的面孔。一个滑动窗口技术有—前使用。在窗口被移动后1pixel的一个子窗口分析（我们使用的2pixel移为了加快速度，没有显着的负面影响）。子窗口的尺寸增加的长度和宽度10%每次的所有子窗口以前的大小进行了详尽地搜索。

3中使用的特征识别

一个特征是一个函数的图像映射到一个真正的数。这里的训练程序。两种类型的基本特征使用。他们是发红的特点和优势边缘方向特征。占主导地位的边缘定位—、红肿特征证明自己是多比Viola和Joss在原来的设置，为我们研究的问题，本田雅阁的检测2004从后面进行。

3.1红斑的特点

我们指的是红的特点是不可测的。他们致力于寻找圆形红色在图像中的区域。他们的目标是发现和解决的红眼睛在以人的照片。他们的大部分工作集中在红色区域的形状，而不是参与找到红色技术。我们借他们的发现是红色的区域观念。我们的不同的工作事实上我们寻找红色区域意味着本田雅阁的刹车灯，而不是人类的眼睛。因此，我们的红色区域的方—奇异的，和更大的比他们的。图1显示了一个通过训练确定发红特征的例子过程。一个特殊的发红的色彩空间的过程中形成的协助在红色区域的检测预处理。

这个色彩空间是从，和一一维度将RGB颜色空间的二维线性组合。所有的在训练集的正、负输入RGB彩色图像，这意味着他们的照片—ELS是由三个8位数字，代表红色的数量，在一个像素的绿色和蓝色，分别—地。红色的颜色空间的每个像素的定义如下：红色= 4R−3G + B。积分图像计算（该技术是在[ 13 ]提出的）应用于红色图像产生的一个在训练过程中输入。红色的区域—确定在固定的时间进行性培训的特点利用红图像的整体形象。

3.2边缘方向特征

使用几个占主导地位的边缘方向特征在训练算法。一个众所周知的灰阶梯度掩模（三×三像素）用在图像中的边缘位置的确定。的掩模被施加在两个坐标方向，和基础执行是放在门槛上的拉普拉斯值强度。我们用一个阈值80消除不晕边有用。一个类似的阈值进行。定位—每个像素”是从它的强度计算在两个方向。方向分为六整个圆分成六箱。重要的是要注意，0◦，方位90◦，和180◦垃圾箱在识别本田是至关重要的。他们是重要的—经常因为本田主要有水平和垂直边缘。的垃圾箱的地方，0或90◦◦处两箱构成问题，因为所有的垂直边界和水平边缘可以分为两箱。我们将所有的垃圾箱。没有提到任何本移动，所以我们相信他们用非移箱。不过他们真的，不同的箱从4到8的数字。有效数字—BER箱不多的冲击性能，但避免这些边界。将所有的方向—全文为0–180◦范围，我们增加了180◦如果角小于0◦，减去180如果角度大超过180◦。这些变革的影响可以在图2中看到的。在图3中，我们看到一个本田雅阁和其在第一站相应的边缘方向的图像−15◦，+ 15◦，+ 165，+ 195◦。检测系统。从74.3提高到89.1%，而一些假阳性率从168下降到26。图像的边缘方向看。每个值B（I，J）的每个方向的bin图像对应—ING拉普拉斯强度的方向是否属于这本，3和4，在图像中的特定区域，通常有一个方向—这是占主导地位的。我们利用这一事实，我们使用占主导地位的边缘取向。这个主意首先发展—利用[。占主导地位的边缘取向的计算同一区域。占主导地位的边缘方向特征进行训练。我们看到一些不区分，但尽管如此明显的边缘在一些其他的垃圾箱图。一个最成功的边缘取向是一个水平如图3所示。所有的POS—可能占主导地位的边缘箱提供培训程序除了因为它视觉上没有什么区分了。

毕业设计我帮你

实时的基于机器学习的检测图像的车的快速训练