#图像分析##软件工程#卷积神经网络Le

#图像分析##软件工程#卷积神经网络Le 引言

车牌识别在交通信息控制与智能交通中发挥着重要作用,如:高速公路收费管理、超速违章处罚、停车场管理、交通数据采集等。通常,车牌识别系统主要包括三个部分:车牌定位、字符分割与字符识别。本篇论文主要研究字符识别。

已经提出很多种字符识别方法[1-4]。字符识别方法大致可以分为两类:基于结构的方法[1,]和基于统计的方法[3,4]。基于结构的方法的优点是符合人的直觉,可以容易地处理局部变换,其主要缺点是抗噪声能力差。基于统计的方法比较成熟,具有抗干扰、噪声的能力,识别性能好,识别速度快的优点,它的难点是特征提取,因此,在统计字符识别中,特征提取的质量是影响系统性能的关键因素。

卷积神经网络在国外的研究较多,但目前在国内的研究与应用还刚刚起步。LeNet-5[5]是一种卷积神经网络,最初用于手写数字识别中,本文将卷积神经网络LeNet-5用于中国车牌字符识别中。由于车牌字符识别的类别比手写数字识别的类别数目多,不能直接应用传统的LeNet-5进行车牌字符识别。因此,对传统的LeNet-5的结构进行了改进。

本文首先简单介绍卷积神经网络和LeNet-5的结构,进而对LeNet-5的结构进行了改进,较好地解决了车牌字符识别类别比手写数字识别的类别多的难题。设计了实验方案,实验对比了改进后的LeNet-5与BP神经网络性能,得出了一些有益的结论,并对进一步的研究工作进行了展望。

1卷积神经网络

卷积神经网络是近年发展起来,并引起广泛重视的一种高效识别方法。现在,卷积神经网络已经成为众多科学领域的研究热点之一,特别是在模式分类领域,由于该网络避免了对图像的复杂前期预处理,可以直接输入原始图像,因而得到了广泛的应用[5-9]。

卷积神经网络通过结合三个方法来实现识别位移、缩放和扭曲不变性[5]:局域感受野、权值共享和次抽样。局域感受野指的是每一网络层的神经元只与上一层的一个小邻域内的神经单元连接,通过局域感受野,每个神经元可以提取初级的视觉特征,如方向线段,端点,角点等。权值共享使得卷积神经网络具有更少的参数,需要相对少的训练数据。次抽样可以减小特征的分辨率,实现对位移、缩放和其它形式扭曲的不变性。

一般地,卷积层后有一个次抽样层来减少计算时间和建立空间和结构上的不变性。通常采用小的次抽样因子,这个方法非常简单和有效。

1.1卷积层

在卷积层,前一层的特征图与一个可学习的核进行卷积,卷积的结果经过激活函数后的输出形成这一层的特征图。每一个输出的特征图可能与前一层的几个特征图的卷积建立关系。一般地,卷积层的形式如式(1)所示:

1.次抽样层

一个次抽样层对输入进行抽样操作。如果输入的特征图为n个,则经过次抽样层后特征图的个数仍然为n,但是输出的特征图要变小(例如,变为原来的一半)。次抽样层的一般形式如式()所示:

其中,down(?)表示次抽样函数。次抽样函数一般是对该层输入图像的一个n×n大小的区域求和,因此,输出图像的大小是输入图像大小的1/n。每一个输出的特征图有自己的β和b。

LeNet-5及其改进

.1LeNet-5的结构

卷积神经网络LeNet-5的结构如图1所示。输入图像要经过大小归一化,每一个神经元的输入来自于前一层的一个局部邻域,并被加上由一组权值决定的权重。提取的这些特征在下一层结合形成更高一级的特征。同一特征图的神经元共享相同的一组权值,次抽样层对上一层进行平均。

卷积神经网络LeNet-5不包括输入,由7层组成,每一层都包括可训练的参数(权值)。该网络的输入是3×3的图像,其中C层是由卷积层神经元组成的网络层,S层是由次抽样层神经元组成的网络层。

网络层C1是由6个特征图组成的卷积层。每个神经元与输入图像的一个5×5的邻域相连接,因此每个特征图的大小是8×8。网络层S是由6个大小为14×14的特征图组成的次抽样层,它是由C1层抽样得到。特征图的每个神经元与C1层的一个大小为×的邻域连接。网络层C3是由16个大小为10×10的特征图组成的卷积层。特征图的每个神经元与S网络层的若干个特征图的5×5的邻域连接。

表1显示了S层的特征图如何结合形成C3的每个特征图,其中的每一列表示S层的哪些特征图结合形成C3的一个特征图,例如,从第一列可知,S层的第0个,第1个,第个特征图结合得到C3的第0个特征图。

网络层S4是由16个大小为5×5的特征图组成的次抽样层。特征图的每个神经元与C3层的一个×大小的邻域相连接。

网络层C5是由10个特征图组成的卷积层。每个神经元与S4网络层的所有特征图的5×5大小的邻域相连接。

网络层F6,包括84个神经元,与网络层C5进行全连接。

最后,输出层有10个神经元,是由径向基函数单元(RBF)组成,输出层的每个神经元对应一个字符类别。RBF单元的输出yi的计算方法如式(3)所示:

.LeNet-5的改进

卷积神经网络LeNet-5最初是用于手写数字识别中,输出的类别数目为10,中国的车牌识别与手写数字识别相比,需分类的类别数目要多很多。除了10个阿拉伯数字外,还有5个英文字母(不包括字母I),全国各省市、自治区的简称31个,还有其它一些字符。

针对中国车牌字符识别与手写数字识别的不同,对传统的LeNet-5进行了改进。主要有以下两点:

(1)将传统的LeNet-5的输出层由10个神经元改为76个神经元。收集到的车牌字符数据库有76类车牌字符,因此,将输出神经元的个数改为76。

()增加传统的LeNet-5网络层C5层的特征图的数目,将C5层特征图的数目由10个增加到个。由于车牌字符识别分类的类别数目增多,因此,考虑增加C5层特征图的个数,以增加整个网络的识别性能。

3实验研究

为了验证改进的卷积神经网络LeNet-5的性能,收集了大量真实车牌数据,并建立了训练与测试用的数据集。车牌图像经过定位,字符分割后,存入车牌字符数据库,没有对车牌图像进行去噪处理。为了应用卷积神经网络LeNet-5,所有的车牌字符都归一化为3×3大小。

图显示了输入字符图像在卷积神经网络LeNet-5前面几层的处理结果,最左边是输入图像,从左到右依次是输入层,C1层,S1层,C层,S层。C1层的输出代表相应地6个特征图。从图中可以看出,神经网络LeNet-5可以很好地提取字符的特征。

3.1实验数据

本文实验所用的车牌图像均由数码相机在实际环境中获取的分辨率为×的真实车牌图像,收集到实际车牌图像数据共个,利用其中的字符分别建立训练数据集与测试数据集,训练数据集与测试数据集之间没有重叠。

图3是实验中用到的一些车牌数据。

3.训练次数与识别率的关系

表显示了当C5网络层特征图的个数为40时训练次数与识别率的关系,从表中可以看到,随着训练次数的增加,训练样本与测试样本的正确率都随着增加。并且当训练样本集的正确率达到%后,继续训练,测试样本集的正确率仍然得到提高,基本不出现过训练的情况。这体现了卷积神经网络良好的性能。

3.3C5层改变对性能的影响

下面是改变C5层特征图的个数对卷积神经网络性能的影响。

3.3.1对识别率的影响

C5层特征图的个数与LeNet-5卷积神经网络的识别率的关系如表3所示。

从表3中可以看到,C5层特征图个数对车牌字符识别率有直接影响,随着C5层特征图个数的增加,车牌字符的识别率也有所提高。这说明,在类别数增加的情况下,增加C5层特征图的个数,可以提高LeNet-5卷积神经网络的分类能力。但当提高到一定程度后,再增加C5层特征图的数目,识别率将不再提高。

3.3.对识别速度的影响

网络层C5层特征图数目的改变对LeNet-5卷积神经网络的速度也有影响。不同C5层特征图个数的识别速度如表4所示。

从表4中可以看到,随着C5层特征图个数的增加,车牌字符识别的速度将变慢。这是由于增加C5层特征图的数目后,提高了LeNet-5卷积神经网络的复杂程度,因此,识别速度有所降低。这说明,可以通过降低网络层C5层的特征图的个数,来提高字符识别的速度。因此,在某些要求实时性高的应用场合,可以适当降低C5网络层特征图的个数。

从上面的实验可知,改进后的LeNet-5在识别率方面优于传统的LeNet-5,但识别速度有所降低。

3.4与BP神经网络的比较

为了测试改进后卷积神经网络LeNet-5的性能,与常用的三层BP神经网络进行了比较。BP神经网络隐含层取个节点,学习率采用0.01,实验结果的比较如表5所示。从表5中可以看到,改进后的LeNet-5卷积神经网络的识别率比BP神经网络的识别率高大约5%。

另外,BP神经网络识别个字符的时间为0.秒,改进后的卷积神经网络LeNet-5的识别速度也优于BP神经网络。

3.5错误数据分析

识别错误的38个车牌字符如图4所示。识别错误的38个车牌字符或者是由于预处理效果不好(字符分割的效果不理想),或者是由于噪声的影响(在字符的关键地方有很强的噪声),还有部分是由于倾斜的影响(倾斜角度很大)。识别错误的字符,可以通过有效的预处理过程来进一步减少。另外,可以通过扩大训练字符集来进一步提高车牌字符识别的正确率。

4结论

本文对卷积神经网络LeNet-5用于车牌字符识别进行了各种研究。为了适应中国车牌字符识别的需要,对传统的卷积神经网络LeNet-5的结构进行了改进。研究结果表明,改进后的LeNet-5比传统的LeNet-5识别率有所提高,对收集到的车牌字符样本识别的正确率达到98.68%。并且从实验中得到LeNet-5的分类性能与卷积层C5层特征图的数目有关。

另外,通过与三层BP神经网络的对比,可以看到改进后的卷积神经网络LeNet-5无论在字符识别的正确率还是识别速度上都优于BP神经网络。进一步研究工作地展望:

(1)试验不同的卷积神经网络。除了LeNet-5之外,试验是否存在更好的适应车牌字符识别的卷积神经网络结构。

()设计和实现基于视频的车牌识别系统。实验用卷积神经网络建立一个比较实用的车牌识别系统,包括车牌定位、字符识别的功能。









































北京治疗白癜风疼不疼
北京治疗白癜风多少钱咨询



转载请注明:http://www.zjiaren.com/jbmb/938.html