初始条件:
(1)数字图像处理的基本理论学习;
(2)Matlab或Visual C++软件工具。
要求完成的主要任务:(包括课程设计工作量及其技术要求,以及说明书撰写等具体要求):
(1)学习研究运动目标检测的原理和方法,并利用Matlab或Visual C++设计程序完成以下功能;
(2)读取交通视频文件;
(3)运用一种背景建模方法,提取背景图像;
(4)读取一帧有运动目标的图像,利用背景差分法,得到差分区域;
(5)对差分区域进行数学形态学处理,得到完整的运动目标区域,并显示运动目标检测结果图;
(6)对检测的结果进行分析比较;
(7)要求阅读相关参考文献不少于5篇;
(8)根据课程设计有关规范,按时、独立完成课程设计说明书。
数字图像处理是通过计算机对图像进行去除噪声、增强、复原、分割、提取特征等处理的方法和技术。在现阶段,数字图像处理迅速发展,其主要受到三个因素的影响:一是计算机的发展;二是数学的发展,特别是离散数学理论的创立和完善;三是广泛的农牧业、林业、环境、军事、工业和医学等方面的应用需求的增长。
一般来讲,对图像进行处理(或加工、分析)的主要目的有以下几个个方面:提高图像的视感质量,如进行图像的亮度、彩色变换,增强、抑制某些成分,对图像进行几何变换等,以改善图像的质量;提取图像中所包含的某些特征或特殊信息,这些被提取的特征或信息往往为计算机分析图像提供便利,提取特征或信息的过程是模式识别或计算机视觉的预处理。提取的特征可以包括很多方面,如频域特征、灰度或颜色特征、边界特征、区域特征、纹理特征、形状特征、拓扑特征和关系结构等;图像数据的变换、编码和压缩,以便于图像的存储和传输。
不管是何种目的的图像处理,都需要由计算机和图像专用设备组成的图像处理系统对图像数据进行输入、加工和输出。
本次课程设计主要是研究了数字图像处理中的运动目标检测,运动目标检测在机器人、视频监控、交通道路检测、军事战争、模拟现实等众多的领域都有极其重要的应用和良好的发展前景。近年来运动目标检测的研究方法在计算机方面一直都处于热门性研究话题,国内外等众多的学者在运动目标检测等方面进行了不懈的努力。
本文主要描述运动目标检测的基本原理,和运用背影差分法检测运动目标的具体实现方法和比较背景建模的几种不同方法,然后选择设计一种合适的方法实现背景建模,最后用视频模拟了交通监控的过程给出实验结果和分析。
对于向地面物体背景较为复杂的背景的运动目标检测,难以用阈值方法进行目标的区分,可采用帧间差分法、背影差分法、光流发等运动分割方法进行检测。帧间差分法直接比较两帧图像对应像素点的灰度值,得到运动目标;背景差分法假定图像背景是固定不变的,将每一帧图像的灰度减去背景的灰度图像得到的运动物体的灰度图像,而在此之前需要建立一个背景图像,背景图像的好坏直接决定了检测的效果,因此建立一个合适的背景图像至关重要。考虑到监控视频一般是固定的,背景除了光影和其他微小变化外不会有大面积的背景改变,故本文采用背影差分法,运用背景建模的方法及实现运动目标的检测。
在进行运动目标检测时,一个很重要的步骤就是区分出运动目标和背景范围,常见的一种情况是摄像机处于静止状态并且焦距也是固定的。此时,图像中的背景区域固定不动。在这种情况下,运动目标识别无论是使用背景差法,还是使用背景差法结合帧间差法,质量良好的背景的建立显得及其重要。另外,当涉及到背景的使用时,一旦背景发生一些变化时,如背景中频繁地出现运动物体,或者光照发生变化、树叶等小物体的晃动等等,使得不能准确地提取背景作为参考图像,从而不能正确地分割出视频序列中的运动物体。为了克服上述问题,国内外众多研究人员提出了背景建立和自适应的背景模型,实现了背景模型的实时更新,能够比较准确地识别出运动目标。在能够满足实时性和实用性要求的前提下,讨论并研究下列几种算法。
手动背景法需要人观察到没有前景物体时启动该帧图像,作为背景图像。这种背景提取方法增加了人力和物力的需求,而且在很多情况下很难在没有前景的情况下获得背景图像,比如高速公路的车辆监测系统、小区的门禁系统等等。这种方法不能实现自适应背景更新的功能,需要使用其他方法修正由于光线,亮度等的变化带来的背景误差。
考虑到运动物体较少的情况下,连续多帧图像中背景的像素值占主要部分,这样在一段时间内变化缓慢,取中值便可以认为是背景图像。统计中值算法从统计学的角度统计单个像素点 (x, y),(i=1,2,…N)在连续帧图像中的亮度值 。在一段时间内对视频序列图像的亮度值(或者色彩信息) 进行排序,然后取中值 (x, y)作为背景。该算法存在的问题在于:图像帧的像素点大多以数万,数十万的数量级出现,而用于取中值的图像帧数量N也应该比较大。对如此大的数组进行排序取出中值,实现时计算量较大,处理较慢。同时需要占用大量的内存单元用于存储数据。
采用算术平均法提取背景图像,可以总结为在特定的时间段内对像素点的亮度和色彩信息取平均值,用均值作为背景图像对应像素点数值。在读入一段视频时,对某一像素点进行观察,会发现在没有前景的运动目标通过时,该点的灰度值保持稳定,变化很小,只有当前景的运动目标通过时,该点的灰度才会发生剧烈的变化。这样就可以连续读入N帧图像,对图像各点的灰度或色彩信息进行统计的方法,使得变化剧烈的像素点变得平缓,取其平均值作为背景图像像素点的值。这样也可以滤除背景图像中的突变噪声点。其统计公式如下:
公式中式中:B (x,y)表示背景图像,Ii(x,y)表示第 i帧序列图像,N表示平均帧数。在实际场景中,一段时间内,同一区域很少有可能总是存在运动物体。而通过平均法得到的背景就会消除亮暗分布不均匀的情况。
由上述仿真实验证明,算术平均法的特点是模型简单,计算方便,可以较好的得到背景图像。但是在仿真过程中,也发现了该方法的一些问题。其中最明显的是,该算法得到背景图像需要获取的图像帧较大。受运动物体数量的影响,随着平均帧数的增加,得到的背景图像的质量越好。由于是求取序列图像的算术平均值,如果N值太小,背景图像中的运动物体不容易被滤除,很容易在背景图像中留下“影子”。而且在运动物体很多,轨迹很固定的情况下,也需要加大N的数值,以使得平均值更加接近与真实的背景图像。在这种情况下,背景的建立就需要较长的时间。本算法也有一定自适应更新功能。随着时间的推移,在背景提取后获取的图像帧也可以作为新的信息量,与背景图像进行统计平均或加权平均,实现背景的自适应更新。因此这种方法也使用于实时背景更新算法。
Surendra背景更新算法能够自适应地获取背景图像,该算法提取背景的思想是对差值图像的亮度值进行判断,如亮度大于阈值,背景图像对应位置的像素点保持不变,否则利用当前帧对背景图像进行替换更新。通俗的来说就是亮度变化不大时,我们认为是背景变化,因此该区域更新背景,亮度变化较大时,我们认为是运动目标,此区域不加入背景更新。其算法可以分成以下几个步骤:
(1)将第1帧图像Ⅰ1作为背景B1。
(2)选取阈值T,迭代次数m=1,最大迭代次数MAXSTEP。
(3)求当前帧的帧差分图像
(4)由二值图像 更新背景图像
式中 , 为背景图像和差分二值图像在(x,y)的灰度值, 为输入的第i帧图像, 为更新速度。
(5)迭代次数m=m+1,进行第(3)步的运算。当迭代次数m=MAXSTEP时结束迭代,此时 可当作背景图像。
在仿真研究中发现,MAXSTEP很大程度地决定了背景建立时的速度, 则决定背景更新的速度。这种背景建模和更新的方法,能够很好地解决物体长时间停留对背景的影响,因为背景的更新会将它逐步地作为背景像素点更新到背景中。但是由于它的基本处理方式是帧间差分,使得它不能将色彩、亮度相似的,大面积的运动物体完整的检测出来。这种情况下,运动物体的某些部分将作为背景区域更新到背景中。
背景差分算法的实质是:实时输入的场景图像与背景图像进行差分,可以较准确的分割出运动目标。但是背景差分算法也有其天然的缺陷,随着时间的推移,场景的光线、树叶的遮挡、或者运动物体滞留都会很大程度的破坏已经建立好的背景图像。为了解决这些问题,最好的方法便是使用背景建模和背景更新算法来弥补。前面已经讨论过相关问题,因此,本文假设背景处于理想情况下进行背景差分算法的研究。
由于刮风、气流等原因,背景中部分物体小幅度晃动;光线的变化等不确定因素,会使得视频图像产生大量噪声,当差值图像二值化后,仍然有很多无用的噪声斑点,因此,需要采用数学形态学方法,对分割后的二值图像进行形态学滤波。数学形态学的主要用途是获取物体拓扑和结构信息。它通过物体和机构元素相互作用的某些运算,得到物体更本质的形态。其基本思想是:利用一个成为结构元素的“探针”收集图像信息。这种基于探测的思想与人的视觉特点有类似之处:总是关注一些感兴趣的物体或者结构,并有意识地寻找图像中的这些结构。数字形态学在本文所涉及到的图像处理中,主要作用包括利用形态学的基本运算,对图像进行观察和处理,从而达到改善图像质量的目的。
形态学的基本运算包括:腐蚀(Erosion)、膨胀(Dilation)、开(Opening)和闭(Closing)运算。用这些算子及其组合来进行图像形状和结构的分析及处理,包括图像分割、特征提取、边界检测、图像滤波、图像增强与恢复等方面的工作。形态学一般以二值图像为处理对象,但也可以用在某些灰度图像的应用中。
(1)结构元素
结构元素被形象的称为刷子或探针,是膨胀和腐蚀操作中最基本的组成部分。它用于测试输入图像,通常比待处理图像小得多。本文使用3×3的结构元素,经开运算处理后,可提取出移动物体。二维结构元素由一个数值为0或1矩阵组成。结构元素的原点指定了图像中需要处理的像素范围,结构元素数值为1的点决定结构元素的领域像素在腐蚀或膨胀操作是需要参与计算。
(2)腐蚀和膨胀
腐蚀和膨胀是许多形态学算法的基础。腐蚀操作会去掉物体的边缘点,细小物体所有的点都会被认为是边缘点,因此会整个被删去。再做膨胀时,留下来的大物体会变回原来的大小,而被删除的小物体则永远消失了。膨胀操作会使物体的边界向外扩张,如果物体内部存在小空洞的话,经过膨胀操作这些洞将被补上,因而不再是边界了。再进行腐蚀操作时,外部边界将变回原来的样子,而这些内部空洞则永远消失了。
通常设X为图像矩阵,B为结构元素矩阵,数学形态学运算时,用B对X进行操作。实际上,结构元素本身也是一个图像矩阵。这里对每个结构元素矩阵B指定一个原点origin。
X被B腐蚀的定义为:
这个公式说明,使用B对x进行腐蚀是所有B中包含于A中的点的集合用×移。
X被B膨胀的定义为:
这个公式表示用B膨胀X的过程是,相对B做关于中心像素的映射,在将其映射平移x,这里X与B映像的交集不为空集。
鉴于背景差分算法也有其天然的缺陷,即如果背景固定,随着时间的推移,场景的光线、树叶的遮挡、或者运动物体滞留都会很大程度的破坏已经建立好的背景图像。这里可以不考虑某一种单一的背景建模方法,我们尝试用多种背景建模方法结合的方式来互相弥补各种方法的不足。
为了解决这些问题,最好的方法便是使用背景建模和背景更新算法来弥补。我们使用算术平均法与Surendra算法相结合的改进的背景建模,此模型初始就可以有一个较好的背景模型,由于运用了Surendra算法更新背景,使这个背景模型对场景的光线、树叶的遮挡、或者运动物体滞留都会很好的适应作用。其算法步骤为:先由算术平均法给出一个初始的背景,然后用Surendra 算法实时的更新背景图像。
图2.1 程序设计框图
一、程序实现
如图3.1所示为该部分程序实现的代码。使用VideoReader函数读取视频,并且将该视频的前六十帧保存为图片,方便接下来的处理。只需要对图片进行操作就行。
二、输出结果
一、程序实现
如图3.3所示为该部分程序实现的代码。这里读取了刚才视频提取出的60帧图像,并且将这些图片做一个算术平均得到了一个背景图片 。
二、输出结果
可以看到相比视频来说得到的背景比较还原没有车的路段了,但是图片里还是有一些车的幻影,因为这是60帧取平均,如果可以取更多的话效果会更好,但是工作量也会变大。
一、程序实现
如图3.5所示为该部分程序实现的代码。使用Surendra算法结合前面均值得到的背景更新背景,可以使得得到的背景更加真实。并且得到了当前帧的图像保存在CurrentImage变量中,以便将其和背景图片一起做处理。
二、输出结果
一、程序实现
如图3.7所示为该部分程序实现的代码。使用背景差分法得到二值化图形,本质就是将当前图片与背景图片做减法得到运动的目标。
二、输出结果
一、程序实现
如图3.9所示为该部分程序实现的代码。这一步主要是将差分二值后的图片作一个腐蚀膨胀的工作,目的是消除细小物体,在纤细处分离物体和平滑较大物体边界,可以让物体成为一个整体,方便我们将其表示出来。
二、输出结果
一、程序实现
如图3.13所示为该部分程序实现的代码。找出图像的八连通区域,将其视为车辆所在的位置,并且用红框将它标记出来,这样就得到了运动目标的整体。
二、输出结果
整个代码部分是一个大循环,持续输出60帧图像的上述操作,效果就是标记出了所有的运动目标。
对部分结果进行验证,修改程序让程序停止在其中几帧观察选取运动目标的效果如何。
在检测交通视频中运动目标的程序设计中,经历了背景提取,二值差分,腐蚀膨胀和标记目标几个阶段。首先将视频分帧保存下来,以便后面只是对图像的处理,这里先保存了60帧,其实更多也可以,但是这里只是为了展示一个效果,将这些图片取一个平均值,就可以得到一个带有一些幻影的背景图片。
整个程序都在一个循环里,我们需要对每一帧图片进行处理,取平均得到的背景和Surendra算法相结合可以得到一个更好的背景。每一帧图像和这个背景相减,大于一个规定阈值的值被保留,就可以得到运动目标的二值图像,对这个图像做腐蚀膨胀去掉细小部分并且将一些缝隙连接,就可以得到相对完整的车辆部分,方便标记它。
程序运行的效果就是在一个视频中不断标记处运动的车辆。