手机版

基于图像的特征信息提取与目标识别

发布时间:2024-11-25   来源:未知    
字号:

基于图像的特征信息提取与目标识别

哈尔滨理工大学

硕士学位论文

基于图像的特征信息提取与目标识别

姓名:盖光建

申请学位级别:硕士

专业:模式识别与智能系统

指导教师:黄金杰

20090301

基于图像的特征信息提取与目标识别

哈尔滨理T大学T学硕上学位论文

基于图像的特征信息提取与目标识别

摘要

基于图像特征信息提取的目标识别系统在各个领域都具有广泛的应用,一直以来都是国内外很多机构和组织的研究对象。而提高识别算法的实时性和准确性对目标识别系统顺利完成目标识别和定位任务具有重要意义。论文的研究目的也正在于此。

在无人飞行器领域中,微型无人直升机由于其飞行的灵活性而倍受研究者的青睐。它利用机载嵌入式视觉系统,可以完成各种军用和民用任务,大大提高了微型无人直升机的实用价值。同时,它体积小、结构简单、自重轻、维护简单,具有很大的发展潜力和良好的应用前景。

国内外对微型无人直升机展开了广泛而深入的研究,其中视频图像处理系统作为微型无人直升机的重要组成部分,主要负责进行目标识别和定位,为导航控制提供重要参考依据。论文通过对以往图像识别技术的研究,设计并实现了适用于微型无人直升机的图像目标分类识别算法,并通过实验证明了算法的有效性。

由于微型无人直升机识别环境的复杂性和摄像机的运动而导致的一般识别算法分类精度不高的缺点,对拍摄图像的特征信息提取和目标识别的方法进行了研究。主要在数字图像预处理的基础上提取图像的有效特征,实现了基于这些特征的支持向量机图像识别方法。针对背景突变的问题,利用高斯混合模型结合支持向量机来处理视频图像,初步构建起一个基于图像的特征信息提取与目标识别的较为完整的快速识别算法。由于充分利用了支持向量机分类器的准确性高和基于高斯混合模型背景建模算法的自适应性好、计算速度快的特点,使识别算法达到较好的实时性和准确性。关键词目标识别;图像处理;支持向量机;高斯混合模型

基于图像的特征信息提取与目标识别

FeatureExtractionandTargetRecognition

BasedonImageInformation

Abstract

Targetrecognitionsystemwhichbased

applicationsinvariousfields,anditsonimagefeaturehascomprehensivebeenasthestudyobjectformanyinstitutionsandorganizationsallOVertheworld.Andtoimprovethethereal—timeandaccuracyoftargetdetectionalgorithmforthesuccessful

andlocationmissionhavea

onrecognitionverycompletionoftheimportantsignificanceandthepurposeofthesisismainlyconcentrated

AtthefieldofUAVthispoint.helicopterflighthighlyresearch,micro—unmanned

civilianfavoredbyresearchersbecauseofitsflexibility.Byusingon—boardvisionembeddedsystems,avarietyofmilitaryandmissiontobecompleted,which

greatlyraiseditspracticalvalue.Andwithitssmallsize,simplestructure,lightweight,themaintenanceofconvenienceandmobility,unmanned

systemshave

isahelicoptershasgreatdevelopmentpotentialandgoodprospectsofapplication.Therefore,themicrounmannedhelicopterrecentlyattractedpartofconsiderable

miniattention.Andimageprocessingsystemveryimportantunmannedhelicopter,whichmainlydealingwithhowtodetecttheobjeetandsupplythenavigationcomputerwithlocMioninformationofthe

Learningfromtheimageobject.recognitiontechnology,thewholeworkincludesdesignandcomplytargetclassificationalgorithm,whichhavebeenprovedvalidthroughemulationexperiments.

Inordertoovercomethelowprecisionshortcomingsofvariedbackgroundandthemovingofthecanmera,thecharacteristicsoftheimageinformationextractionandtargetrecognitionmethodswerestudied.

Theproposedalgorithmrealizedthetargetrecognition

onmethodwiththethedigitalimageSVMclassifierandtheeffectiveimagefeatureswhichbased

基于图像的特征信息提取与目标识别

preprocessmg

Foragainstthemutationsbackground,theimagedetectionalgorithmdealedwithvideoimagewiththeGaussianmixturemodelcombiningsupportvectormachinesandsetupamorecomprehensivesystemofrapidtargetidentification.

Withthecharacteristicsofsupportvectormachineclassification’saccuracyandGaussianmixturemodel’Sself-adaptiveandfastspeed,theproposedmethodisabletoachieveamuchbetterrealtimeandaccuracyproperty.

Keywordstargetrecognition,imageprocessing,supportvectormachine,

gaussianmixturemodel

基于图像的特征信息提取与目标识别

哈尔滨理工大学硕士学位论文原创性声明

本人郑重声明:此处所提交的硕士学位论文《基于图像的特征信息提取与目标识别》,是本人在导师指导下,在哈尔滨理工大学攻读硕士学位期间独立进行研究工作所取得的成果。据本人所知,论文中除已注明部分外不包含他人已发表或撰写过的研究成果。对本文研究工作做出贡献的-I"A.sFⅡ集体,均已在文中以明确方式注明。本声明的法律结果将完全由本人承担。作者签名:域日期:如岬年乡,4/2E]

哈尔滨理工大学硕士学位论文使用授权书

《基于图像的特征信息提取与目标识别》系本人在哈尔滨理工大学攻读硕士学位期间在导师指导下完成的硕士学位论文。本论文的研究成果归哈尔滨理工大学所有,本论文的研究内容不得以其它单位的名义发表。本人完全了解哈尔滨理工大学关于保存、使用学位论文的规定,同意学校保留并向有关部门提交论文和电子版本,允许论文被查阅和借阅。本人授权哈尔滨理工大学可以采用影印、缩印或其他复制手段保存论文,可以公布论文的全部或部分内容。

本学位论文属于

保密,口在年解密后适用授权书。

不保密d

(请在以上相应方框内打4)

作者签名:亟澧

巍瓢,日期:研年孑,92zEl日期:.硼年乡彤汨导师签名:

基于图像的特征信息提取与目标识别

哈尔滨理T大学工学硕上学位论文

第1章绪论

1.1课题背景

无人驾驶飞机又称无人机(UAV,UnmannedAerialVehicle),它通过安装在飞机内控制系统或者地面控制站来代替人完成对飞行器的控制。在军事上,无人机可以作为空中侦察平台和武器平台,通过携带不同的设备,执行侦察监视、激光制导、电子干扰、通信中继、目标定位、战斗评估、精确打击、定点轰炸等任务,甚至还可以拦截战术导弹和巡航导弹,代替人员在核生化或其他特殊条件下执行作战任务。在民用上,无人机可应用于场区监控、气象探测、公路巡视、勘探测绘、航空摄影、交通管理、线路查巡、森林火灾救护等。

在无人飞行器研究领域中,微型无人直升机由于其飞行的灵活性而倍受研究者的青睐。尤其是在直升机悬停、横飞、慢速巡行等特有的飞行方式下,利用机载嵌入式视觉系统,可完成巡航地形勘测,军事侦察等任务,大大提高了微型无人直升机的实用价值。同时,无人直升机体积小、结构简单、自重轻、成本低、维护方便、灵活性好,具有很大的发展潜力和良好的应用背景。

微型无人直升机的目标识别由于平台的特殊性和识别环境的复杂性,使整个识别任务非常的困难。再者由于技术的敏感性,所以国内外并没有太多专门介绍微型无人直升机目标识别方面的文献。但作为图像识别的一个特殊方向,可以通过借鉴其它图像识别问题的先进技术,为系统设计相适应的算法。

论文将通过对无人机采集的图像的特征信息及目标识别进行系统的、深入的研究,分别给出图像特征空间下基于图像轮廓特征、形状特征、统计特征、GMM参数特征等方法的图像预处方法理及其相应的特征提取算法,并应用经优化后的SVM作为分类器来分类目标图像。同时针对图像背景突变的问题,利用高斯混合模型结合支持向量机来处理视频图像,初步构建起一个基于图像的特征信息提取与目标识别的较为完整的快速识别算法。

近几年,在微型无人直升机飞行过程中,通过对地面目标(注:论文中所指是人工目标标志、危险品图标等置于陆地的平面标志的统称)自动识别,辅助飞行器自主飞行的定位和导航,实现基于机器视觉的识别功能,已成为微型无人直升机研究领域中的热点之一。

基于图像的特征信息提取与目标识别

哈尔滨理工大学工学硕士学位论文

1.2微型无人直升机目标识别系统的国内外研究现况

近几年,国内外对微型无人直升机展开了广泛而深入的研究,其中视频图像处理系统作为微型无人直升机的重要组成部分,主要负责进行目标识别和定位,为导航控制提供重要参考依据,实现基于机器视觉的识别功能,具有广泛的应用背景和较好的发展潜力。

国际上对微型无人机的研究大都是围绕国际空中机器人竞赛(International’sAerialRobotCompetition,IARC)u刭来进行的,这个比赛由国际无人飞行器协会AUVSI举办,每年举行一次。众多的知名大学都参与了这个比赛,如斯坦福大学、柏林工业大学等。

目前IARC参赛队的飞机大都是小型的直升机,这是因为跟固定翼飞机相比,小型无人直升机更加灵活,具有更高的自由度,能够适应复杂多变的环境,更适合进行目标识别、定位等IARC比赛项目;且在实际应用当中,小型无人自主直升机具有高度的灵活性和很强的适应性。如在一年一度的IARC中都有关直升机自主飞行过程中对特定目标自动识别的相关竞赛项目。

中国自动化学会机器人竞赛工作委员会和科技部高技术研究发展中心于2004年“月在西安举办了首届中国空中机器人比赛(AerialRobotCompetitionofChina,ARCC)。该比赛的内容涉及机械、电子、计算机、自动化等多个学科,技术创新性和多学科综合性使之成为青年科技活动中极具挑战性的一项赛事,吸引了众多高校和科研院所的关注。在参加ARCC的旋翼组的竞赛中,所有的参赛队都采用了微型无人直升机。其中对地面未知目标的识别是作为旋翼组竞赛的重要任务之一p1。

1.2.1微型无人直升机目标识别实现难点

与传统的文字识别(OCR)、人脸识别、工件识别等常见图像识别系统不同,微型无人直升机的目标识别由于平台的特殊性和识别环境的复杂性,使整个识别任务非常困难。这些难点主要集中在以下这几个方面:

1.载体平台的特殊性对于常规的图像识别系统而言,摄像机通常是固定不动的,甚至拍摄目标摄像机的距离也是不变的。同时摄像机的焦距等参数都是调整好或是缓慢变的。但是在微型无人直升机平台上,摄像机安装在直升机上,由于直升机处于动的状态,因此摄像机相对于目标的高度、观察的角度始终在变化,在直升机拍摄的照片中,同一个目标就表现出多种形态,同时存在

基于图像的特征信息提取与目标识别

哈尔滨理工人学工学硕士学位论文

着尺度、位置和几何态的变化。这些变化造成识别难度大大增加。另一个受平台影响的就是机载摄像机的选型,由于微型无人直升机负重和形的影响。对摄像机的体积和重量都很有限制。这使一些高档的摄像机无法使用。体积小,重量轻的低质量摄像机会使采集的图像由于硬件先天的原因难以识别。

2.环境的复杂性微型无人直升机的工作地点在野外,目标的背景可以说千变万化,而且这种变化是连续不断的,也是不确定的。例如,假设当前拍摄到的图像背景是水泥地,而在几秒钟后,背景变成了绿色草坪,再过几秒钟,又变成了水面,等等。如此复杂多变的背景使得图像的阈值分割没有统一的标准。同时,野外的飞行环境还必须考虑光线,遮挡等问题,这些问题也增加了目标识别难度。

3.噪声干扰问题前文已经提到,如果图像信号采用微波视频传输方式,那图像的干扰问题就必须考虑。由于微波视频传输是模拟传输,很容易受到高层建筑、地理环境和其它射电源影响产生干扰,这会使基站接收到的图像存在不同程度的失真。

4.实时性要求目标识别的输出结果将供飞行导航和控制的参考,因此微型无人直升机识别系统必须有较高的实时性,处理速度要尽可能得快。惯性导航单元和电子罗盘等设备作为直升机姿态控制和导航的主要依据,必须具有较高的输出频率,否则将会发生不可预料的后果。而目标识别的速度能稳定在几个Hz就足够满足要求了。遗憾的是,即使目标识别仅仅是个软实时任务,由于图像运算的复杂性,速度要求依然是整个目标识别的难点之一。

1.2.2相关图像目标识别技术综述

由于本系统的特殊性,所以国内外并有太多专门介绍针对微型无人直升机台的目标识别方法的文献。但是作为图像识别的一个特殊问题,可以通过借鉴其它图像识别问题的先进技术,为系统设计相适的算法提供思路。

目前国内外的图像研究主要集中在人脸识别、字体识别、车牌识别和工业检测等领域。识别方法主要是基于传统模板匹配的识别方法和基于统计模式识别方法。

1.传统模板匹配的识别方法其中模板匹配是最经典的方法,最为简单的例子就是直接计算两图像之间的相似程度。但是对于这种粗糙简单的算法而言,划分相似阈值是困难和痛苦的事,这需要大量的实验来确定。同时,这种算法很容易受识别对象的环境影响造成很高的误判率。随着图像学的发展,人

基于图像的特征信息提取与目标识别

哈尔滨理T大学T学硕上学位论文

们从更深层次挖掘图像对象的特征,从将简单直观的原始图案作为模板渐渐发展出将图像的代数特征、几何特征以及其它特定的结构特征来作为图像模板的模板匹配技术。

基于几何特征的模型应用到图像识别上便成为基于图像几何特征的图像别技术。它直接测量图像特征之间的相对位置和其它参数作为识别特征。典型几何特征包括人脸识别问题中:鼻子的垂直位置和宽度,嘴的垂直位置,宽度、高度、上下嘴唇厚度,描述下巴形状的多个数据等;车辆识别问题中:车窗大小,保险杠长度等。为了使测量结果不受方位、缩放和旋转的影响,测量前,必须对待测特征进行标准化。测量结果以向量的形式存储。一旦得到了输入图像的几何特征向量,就可把它与数据库中已有的向量比较,寻找最佳匹配向量作为识别结果。早期的基几何特征的图像识别包括BledsoeH,KayatSj等人的工作。不过这种方法对于个别图像在遮挡(残缺)、模糊的情况下,效果很差。同时,针对不同的识别对象这种算法需要为每个识别对象手动建立几何特征数据库,大大增加了工作复杂性。

基于主元分析法(PrincipalComponentAnalysis,PCA)的人脸识别技术是一种典型的基于图像代数特征的识别方法。采用PCA的目的是从人脸图像中抽取全局特征,对图像空间进行降维处理,同时描述不同人脸图像之间的变化。这方面的工作以1、酞和PeIltl觚d的Eig饥f.ace巾川(特征脸)最具代表性。遗憾的是,这种方法易受光线影响,同时它是一种比较复杂的算法,并未对实时性进行优化,不适于微型无人直升机目标识别系统。

除了一般意义的几何和代数特征,矩是一个能很好描述对象特征的特征量,它具有旋转、平移、尺度不变的特性和良好的抗噪性。图像的矩特性实质上是图像空间特性的集成。目前常用的矩特征有Hu不变矩、Li矩、DS矩等。尤其是Hu不变矩,美国南加州理工大学就将Hu不变矩作为图像特征完成了基于视觉导航的微型无人直升机自动降落惮1。

虽然这种算法能有效解决识别标志尺度变化、旋转等问题,并且实现简单。不过,采用这种算法也存在着以下缺陷p’:

(1)识别对象特征反映不全面。仅仅7个值有时很难全面的反映复杂图像的特征,并且通过实验可以发现在采用这种图像识别方法过程中往往7个不变矩值中只有3个对识别贡献较大,其余4个对图像的区分性很小。

(2)对图像完整性要求高。由Hu不变矩的定义公式可以看到,当图像被遮挡或残缺时,采用该识别算法会大大提高误判率。

(3)阈值选取困难。由于对阈值的选择没有统一的标准,所以还是主要依

基于图像的特征信息提取与目标识别

靠实验的方法。这对飞行环境复杂,且不适合作大量飞行实验的飞行器平台而言,图像区分阈值选取会非常困难。

而目前目标检测技术广泛地采用模板匹配法。设模板大小为h×W,待考察图像大小为mxn,模板匹配的方法是把模板覆盖在图像上,比较模板和被覆盖子图像的差别,若差别小于某事先设定的阈值则认为此子图像符合模板;在图像上逐像素点移动模板进行计算,即可计算图像中有多少符合模板的图形。

上述的模板匹配算法有以下不足:

(1)计算量大,随着图像和模板的增大需要的计算量迅速增加;

(2)图像的平均灰度值的变化会影响匹配结果的正确性;

(3)对图像的方位旋转和尺度放缩不适应。

由于存在以上问题,不少人提出了各种改进的模板匹配算法,如序列相似性检测算法u川、自学习阈值匹配u¨、结合RST不变矩的匹配算法等。前几种采用的仍旧是点对点的灰度值比较方法,主要在匹配的过程和方法上进行了多种改进;这类方法由于往往采用了种种快速算法,因而较好的解决了普通模板匹配算法中存在的计算量过大的问题,但是对于景物平均灰度值变化和景物的旋转放缩仍旧显得不足。后一种通过计算模板的不变矩,并同待匹配的子图像比较,得到匹配结果,它们受景物平均灰度值和旋转尺寸放缩影响较小,但不变矩本身计算量较大。

另外,D.L.Bamea等提出使用模板子图像差值相似性的图像匹配技术¨剖,它比使用FFT计算互相关相似性测度的图像检测方法有更高的性能;Brrow等提出了距离变换和Chamfer匹配技术¨川,可用于图像匹配中确定匹配控制点的过程。M.Svedlow等对图像匹配的相似性测度和图像预处理方法进行了比较分析uq。H.Maitre等提出了基于自回归模型的动态程序设计方法用于几何畸变较大的图像的匹配¨川。Takagi等根据NOAA卫星遥感图像中海岸线较为明显且常年保持不变的特点,提出了基于遥感图像边缘特征的快速匹配算法¨叫。该算法先由遥感图像沿海岸线取出若干个典型区域进行边缘提取,然后由标准海岸线数据形成与这些边缘区域相对应的标准海岸线区域,最后将这些区域当作特征点,根据它们之间的匹配结果确定实际遥感图像的空间几何变形参数。Hirata等又进一步将这些方法应用到不同分辨率的遥感图像间的匹配上。

Flusser针对变形图像间的匹配又提出一个自适应映射方法,自动地对两幅遥感图像进行分割,使得分割后两幅图像上相应子块间的相似度较大,根据这些子块之间的空间位置关系来对原来的两幅图像进行匹配I"J。在国内,李智等提出了基于轮廓相似性测度的图像匹配方法¨引,它适用于

基于图像的特征信息提取与目标识别

轮廓特征丰富的图像的匹配。王小睿等提出并实现了一种自动图像匹配方法,用于图像的高精度匹配¨w,但实际上它只是一种以互相关系数作为相似性测度的半自动图像匹配方法。郭海涛等提出了一种将遗传算法(GeneticAlgorithm,GA)用于图像匹配的算、法l删’。张祖勋等提出了采用多级图像概率的松弛整体匹配技术,用于不同传感器和空间分辨率的遥感图像的快速匹配睇¨。熊兴华等提出将遗传算法和最/b-乘法结合起来用于图像的子像素级进行匹配的方法‘221。

由此可见,图像匹配技术经过多年的研究,已经取得了很多研究成果,例如在图像的相似性检测方面研究出了多种技术方法。但是由于图像匹配的输入数据来源的多样性,以及不同的应用对图像匹配的要求各不相同,同时,由于影响图像匹配的因素的多样性,以及匹配问题的复杂性,图像匹配的技术还有待于进一步发展。另外因直升机在空中飞行的过程中拍摄地面景物,拍摄的目标可能同时存在放缩、旋转、形状改变这多种变换,加上室外飞行条件中存在光照等影响,使得通过点对点的灰度值比较来确定匹配度的方法有一定局限。

2.基于统计模式识别的方法传统的直接识别方法虽然具有算法成熟、实现简单等优势,但在实际应用中依然存在着一些缺陷。首先,对于采用色彩、几何形状为识别特征的识别方法,容易受到环境和背景变化的影响。如光线的明暗变化、识别目标背景的变换以及形态相似物体的干扰都会造成误判率的提高。虽然可以在识别算法中增加限制条件(如不变矩)提高识别性能,但这会提高识别算法的复杂性、降低飞行器图像处理实时性的性能,同时也提高了对图像预处理(光线均衡、抗噪处理、二值化处理等)的要求。其次,直接识别方法的参数调整很大程度依赖实验调整,如模板匹配相似度的阈值、不变矩差值的阈值等等。针对这些缺陷,个人认为可以采用了基于机器学习的识别方法来解决特征标志的识别问题。

与传统的统计学方法相比,统计学习理论SLT(statisticalLeaningTheory)睇,J是一种专门研究小样本情况下机器学习规律的理论。该理论针对小样本统计问题建立了一套新的理论体系,这种体系下的统计推理规则不仅考虑了对渐近性能的要求,而且追求在现有有限信息的条件下得到最优结果。

支持向量机(SupportVectorMachines,SVM)是建立在统计学习理论的VC维理论和结构风险最小化原理基础上,根据有限的样本信息在模型的复杂性(即对特定训练样本的学习精度,Accuracy)和学习能力(即无错误地识别任意样本的能力)之间寻求最佳折衷,以期获得最好的推广能力(Generalization

‘Ability)。

基于图像的特征信息提取与目标识别

SVM理论源于Vapnik在1963年提出的用于解决模式识别问题的方法u“q。到九十年代中期,随着其理论的不断发展和成熟,也由于神经网络等学习方法在理论上缺乏实质性进展,统计学习理论开始受到越来越广泛的重视。它最初是为了解决小样本、非线性及高维识别等分类问题提出的,后来被推广到处理线性不可分的数据问题上。这种方法主要是从训练集中选择一组特征子集,使得对特征子集的线性划分等价于对整个数据集的分割。这组特征子集称为支持向量(SupportVector,SV)。对SV的研究主要集中在对分类函数的改进和函数预测上,后来人们提出使用线性不等约束重新构造SV的核空间,解决了一部分线性不可分问题,为SVM的研究开辟了道路。

SVM可以用于各种学习和表示,如神经网络、径向基函数、样条及多项式估计等¨“M。不同于常规统计学习理论和神经网络等方法,SVM不是通过特征个数变少来控制模型的复杂性,而是提供了一个与问题维数无关的函数复杂性的有意义刻画与映射,使得在高维特征空间中构造的线性决策边界可对应于输入空间的非线性决策边界。概念上,通过使用具有很多个基函数的线性估计量,使在高维空间控制逼近函数的复杂性提供了很好的推广能力;计算上,在高维空间上利用线性函数的对偶核,解决了数值优化的二次规划求解问题。支持向量机是当今的一个研究热点,是统计学习理论中最年轻也是最实用的部分。它具有如下4个显著的特点:

(1)专门针对有限样本的情况,采用结构风险最小化原则而不是经验风险最小化原则,提高了分类器的推广能力;

(2)利用Mereer核实现线性算法的非线性化,巧妙地解决了维数灾难问题,使其算法复杂度与样本维数无关;

(3)稀疏性,即只有少量样本(支持向量)的系数不为零,减少了核形式判别式的计算量;

(4)算法设计成凸二次规划问题,从理论上说,得到的将是全局最优点,解决了神经网络方法中无法避免的局部极值问趔删J叫。

目前SVM在分类、回归、聚类和时问序列分析方面都有应用。例如手写体阿拉伯数字识别、人脸检N/识别、文本分类、故障诊断、缺陷识别、说话人确认、生物医药信号处理、系统辨识、金融工程、生物信息技术、自适应信号处理、视频字幕自动定位与提取、时间序列预测和数据挖掘掣叫枷1。SVM方法在理论上具有很突出的优势,但与其理论研究相比,其应用研究相对比较落后。目前SVM主要是作为模式识别的工具,在图像处理和其它方面的研究较少。2001年Gomez.Moreno等人将SVM用到图像边缘识别的问题,文中选取

基于图像的特征信息提取与目标识别

哈尔滨理工大学工学硕J:学位论文

边缘样本和非边缘样本,经SVM训练泛化后求解出图像边缘与非边缘的分界超平面,收到了一定的效果,但此方法的使用有赖于训练样本的选择。2003年,Kotropoulose等人研究了医学造影图像的分割问题,文中采用不同核函数的SVM进行图像分割对比,实验证明用RBF核函数可以获得最佳的效果Ⅲ1。2004年Lin等人提出了一种基于SVM的中值滤波器,他们利用椒盐噪声的分布特性和幅值特性来训练SVM网络,使SVM具有噪声与非噪声的分辨能力,在实验中,获得了比传统中值滤波更好的去噪效果州。可以看出,SVM的应用研究已不在局限于模式识别问题,已经开始在图像处理等其它领域有了一些成果,但很多都是基于SVC(Support

用SVM回归特性(SupportVectorVectorClassification)原理研究的,利Regression,SVR)进行图像处理的不多。

1.3主要研究内容

本课题来源于国家自然科学基金(No.60575036)、黑龙江省教育厅科技基金(No.11511074)、哈尔滨理工大学优秀拔尖创新人才培养基金(No.20070105)和哈尔滨市科技创新人才研究专项资金(No.2007RFXXG023)项目的部分研究内容。

论文主要研究内容:

1.微型无人直升机目标识别系统所涉及到的图像处理基础知识。

主要内容有:静态图像的采样和量化,数字图像的数据表达,滤波,灰度直方图均衡化,图像边缘检测、视频捕获、目标识别等。

2.研究图像特征信息提取的基本方法,并在此基础上形成新的、效率较高的特征提取方法。

3.研究支持向量机在特征信息提取和目标图像识别方面的应用。

4.提出一种新的基于高斯混合函数图像分割算法及相应的视频目标识别算法,同时与基于SVM的视频目标识别算法相结合以提高识别算法的实时性。

基于图像的特征信息提取与目标识别

哈尔滨理T大学工学硕上学位论文

第2章数字图像处理与基于熵的图像分割处理

数字图像处理是相对于模拟图像处理而言的。它的基本内涵是将模拟图像变为数字形式的图像,利用计算机技术对其进行存储、处理、传输、输出。自上世纪70年代以来,由于数字技术和计算机技术的迅猛发展给数字图像处理提供了先进的技术手段,“图像科学”也就从信息处理、自动控制系统理论、计算机科学、数据通讯等学科中脱颖而出,成为旨在研究“图像信息的获取、传输、存储、变换、显示、理解与综合利用”的崭新学科m删。图像科学已成为各高技术领域的汇流点。数字图像处理主要包括的内容:图像数字化及编码的压缩、图像增强和复原、图像增强、图像分割和分类及图像重建等。

而随着数字图像处理技术的发展,出现了一种与基本的图像变换、处理不同的问题,就是要在经过图像处理后,提取图像的特征,进而对图像加以判断分类或分析理解。这种把图像进行分类的问题就是图像的模式识别。图像的模式识别己形成几大类,即统计模式识别、结构模式识别、模糊集识别等。根据论文的讨论重点,以下主要介绍统计模式识别的基础知识。

基于统计模式识别方法的系统主要由以下几个部分组成:信息获取、预处理、特征提取和选择、分类决策,如图2.1所示。

图2-1统计模式识别方法系统构成

Fig.2-1Basicconstitutesofstatisticalpatternrecognitionsystem

以下对这几个部分作一下简单说明:

1.信息获取为使计算机能够对各种现象进行分类识别,要使用计算机可以运算的符号来表示所研究的对象。通常输入对象有二维图像(如文字、指纹、地图、照片等)、一维波形(如脑电图、机械震动波形等)和物理参量和逻辑值(如模糊逻辑)等。在论文中主要是通过摄像机来获取关于要识别的视频图像信息。

基于图像的特征信息提取与目标识别

哈尔滨理T大学工学硕士学位论文

2.预处理预处理的目的是去除噪声,加强有用信息,并对输入测量仪器或其它因素所造成的退化模糊现象进行复原。在论文中主要是对获取的图像进行增强去噪预处理,以突出图像的有用信息。

3.特征的提取和选择由于图像或波形所获得的数据量是相当大的,一个文字图像可以有几千个数据。为了有效地实现分类识别,就要对原始数据进行变换,得到最能反映分类本质地特征。这就是特征提取和选择的过程。

4.分类决策分类决策就是在特征空间中用统计方法把识别对象归为某一类别。基本作法是在样本训练集的基础上确定某个判决规则,使按这种判决规则对被识别对象进行分类所造成的错误识别率最小或引起的损失最小。2.1数字图像处理的基础知识

2.1.1静态图像的采样和量化

一幅连续图像数据可以用Z=厂∽y)表示,z轴方向的模拟量就是图像的明暗程度数据,石,Y坐标则指明了采样点的位置。一幅图像的工坐标和Y坐标以及幅度可能都是连续的。为了把它转换成数字形式,必须在坐标和幅度上都做采样操作。数字化坐标值称为采样,数字化幅度值称为量化。坐标上的采样操作实际上就是在x轴和Y轴上同时进行采样,采样点就称为像素(Pixel)。用离散的像素点位置上的灰度值来表示原来的连续的图像就是图像的数字化。

像素的排列在X轴和Y轴两个方向分别以等间距进行采样后得到矩形阵列。图像的各个像素包含着明暗信息,必须具有合适的量值。图像的各个像素的明暗程度表示得越正确,图像就越能正确地重现出来。如何选择合适的量化精度,需要根据具体的应用场合进行选择。.

为了让图像用人眼看上去效果比较好,就要考虑人眼的视觉特性。在理想状态下,人眼最多能识别500级灰度,因此,量化精度定为9比特就足以表现出一幅灰度图像了;现在广泛使用的CRT显示器能表现的灰度级为4到6比特左右,对电视图像来说,这样的量化精度已经能达到要求;在图像分析等领域,灰度级的精度直接影响到处理结果。因此,一般采用10比特或更高的量化精度。所以,一般的量化精度都在1到lO比特之间。实际应用中,用3到5比特的精度量化出来的图像在印刷等应用中也能得到较好的画质。

基于图像的特征信息提取与目标识别

哈尔滨理T大学工学硕士学位论文

2.1.2动态图像的采样和量化

动态图像归根结底还是静态图像的采样和量化,不同的是要考虑连续两次采样之间的时间间隔。由于人眼具有视觉暂留的特性,且暂留时间约为30ms,因此,播放电视时每秒播放30帧图像就能达到很好的动态效果。如果要进行图像检测,所检测对象状态变化速度的快慢将决定采样时间间隔的大小。首先对状态变化进行傅立叶变换,所得频谱中最高频率记为厂,由采样定理知,每秒必须采样处理2厂帧图像才能很好地描述对象状态的变化。2.1.3数字图像的数据表达

数据和算法是任何程序的两个最主要的组成部分,而数据的组织结构将对算法的简化和使用带来重大的影响。本节介绍两种描述图像的数据结构。

1.二维空间数组二维数组是表达图像中区域的一种方便、简单、直观的方法。图像矩阵中任意一个整数对应该像素点的灰度,或者对应该像素点颜色中的某一属性。任意像素点信息可以通过该像素点坐标从矩阵中获取相应的图像信息。通常该矩阵有三种表现形式:二值图像、灰度图像和彩色图像。

2.金字塔形结构采用分层数据结构,利用算法形成一种数据处理策略,从而减少数据处理的数量,加速数据处理速度,是解决计算机视觉的数据计算耗时长的有效手段。其中,金字塔形结构是最简单的分层数据结构,它是由一系列图像{M。,M纠,…M。}组成。M。是原始图像位于金字塔的底层,图像M。是图像MH经过一定的数据提取算法获取的更高一层的数据图像,图像尺寸相应减少三倍,最终形成一个金字塔形状。可以采用先粗后精的数据处理策略,将极大的提高数据处理速度。

2.2图像增强

由于微型无人直升机目标识别图像都采集于自然条件,不可避免的存在噪声。且一般情况下,各类图像系统中图像的传送和转换(如成像、复制、扫描、传输以及显示等)总要造成图像的某些降质。在大气环境中,由于空气介质的散射和吸收作用,使空中图像产生一定的灰白效应,图像对比度大幅度下降:冷热空气的流动会使图像模糊;其他还有一些由于摄像机镜头的几何形状造成的图像部分失真现象等。所以必须对采集的原始图像进行预处理。考虑到的实际使用情况,本节仅仅对图像进行增强去噪处理。

基于图像的特征信息提取与目标识别.doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印
    ×
    二维码
    × 游客快捷下载通道(下载后可以自由复制和排版)
    VIP包月下载
    特价:29 元/月 原价:99元
    低至 0.3 元/份 每月下载150
    全站内容免费自由复制
    VIP包月下载
    特价:29 元/月 原价:99元
    低至 0.3 元/份 每月下载150
    全站内容免费自由复制
    注:下载文档有可能出现无法下载或内容有问题,请联系客服协助您处理。
    × 常见问题(客服时间:周一到周五 9:30-18:00)