数字图像处理技术的现状及其发展方向_陈炳权
第30卷 第1期
2009年1月吉首大学学报(自然科学版)JournalofJishouUniversity(NaturalScienceEdition)Vol.30 No.1 Jan.2009 文章编号:1007-2985(2009)01-0063-08
数字图像处理技术的现状及其发展方向
陈炳权1,2,刘宏立1,孟凡斌23
(1.湖南大学电气与信息工程学院,湖南长沙 410082;2.吉首大学物理科学与信息工程学院,湖南吉首 416000)摘 要:综述了数字图像处理技术的主要特点和优点,阐述了包括图像采集与数字化、图像的压缩、图像的增强与复原、图像的分割和图像分析等主要内容的产生及其发展历程,并根据该领域的最新进展,简述了数字图像处理技术5个主要研究方面的最新热点,最后总结了数字图像处理技术领域中面临的主要挑战和未来发展方向.
关键词:图像数字化;图像压缩;图像分割;图像增强与恢复;图像分析中图分类号:TN911.73;TP391 文献标识码数字图像处理()将图像信号转换成数字信号并利用计算机对其进行处理,起源于20世纪20年代,、工农业生产、生物医学工程、航空航天、军事、工业检测、机器人视觉、公安司法、军事制导、文化艺术等,已成为一门引人注目、前景远大的新型学科,发挥着越来越大的作用.数字图像处理作为一门学科形成于20世纪60年代初期,早期的图像处理的目的是改善图像的质量,以人为对象,以改善人的视觉效果为目的,首次获得实际成功应用的是美国喷气推进实验室(JPL)[1],并对航天探测器徘徊者7号在1964年发回的几千张月球照片使用了图像处理技术,并考虑了太阳位置和月球环境的影响,由计算机成功地绘制出月球表面地图,随后又对探测飞船发回的近十万张照片进行了更为复杂的图像处理,以致获得了月球的地形图、彩色图及全景镶嵌图,为人类登月创举奠定了坚实的基础,也推动了数字图像处理这门学科的诞生.数字图像处理取得的另一个巨大成就是在医学上获得的成果,1972年英国EMI公司工程师Housfield发明了用于头颅诊断的X射线计算机断层摄影装置即CT(ComputerTomograph).1975年EMI公司又成功研制出全身用的CT装置,获得了人体各个部位鲜明清晰的断层图像.1979年这项无损伤诊断技术获得了诺贝尔奖,说明它对人类作出了划时代的贡献.[2]随着图像处理技术的深入发展,从70年代中期开始,随着计算机技术和人工智能、思维科学研究的迅速发展,数字图像处理向更高、更深层次发展.人们已开始研究如何用计算机系统解释图像,实现类似人类视觉系统理解外部世界.很多国家,特别是发达国家投入更多的人力、物力到这项研究,取得了不少重要的研究成果.其中代表性的成果是70年代末MIT的Marr提出的视觉计算理论[3],这个理论成为计算机视觉领域其后多年的主导思想.图像理解虽然在理论方法研究上已取得不小的进展,但它本身是一个比较难的研究领域,存在不少困难,因人类本身对自己的视觉过程还了解甚少,因此计算机视觉是一个有待人们进一步探索的新领域.正因为如此,图像处理理论和技术受到各界的广泛重视,当前图像处理面临的主要任务是研究新的处理方法,构造新的处理系统,开拓更广泛的应用领域.
1 数字图像处理技术的主要特点、优点及处理过程
1.1数字图像处理的主要特点
(1)目前数字图像处理的信息大多是二维信息,处理信息量很大,因此对计算机的计算速度、存储容量等要求较高.(2)3收稿日期:2008-10-16
基金项目:国家自然科学基金资助项目(60702076)
作者简介:陈炳权(1972-),男,湖南桃源人,吉首大学物理科学与信息工程学院副教授,湖南大学电气与信息工程学院博士研究生,主要从事信号处理与智能控制研究;刘宏立(1963-),男,湖南常德人,湖南大学教授,博导,主要从事高速移动通信网等方面研究.
数字图像处理技术的现状及其发展方向_陈炳权
64 吉首大学学报(自然科学版)第30卷数字图像处理占用的频带较宽,与语言信息相比,占用的频带要大几个数量级.所以在成像、传输、存储、处理、显示等各个环节的实现上,技术难度较大,成本也高,这就对频带压缩技术提出了更高的要求.(3)数字图像中各个像素是不独立的,其相关性大.因此,图像处理中信息压缩的潜力很大.(4)由于图像是三维景物的二维投影,一幅图像本身不具备复现三维景物的全部几何信息的能力,很显然三维景物背后部分信息在二维图像画面上是反映不出来的.因此,要分析和理解三维景物必须作合适的假定或附加新的测量.在理解三维景物时需要知识导引,这也是人工智能中正在致力解决的知识工程问题.(5)数字图像处理后的图像一般是给人观察和评价的,因此受人的因素影响较大.由于人的视觉系统很复杂,受环境条件、视觉性能、人的情绪爱好以及知识状况影响很大,作为图像质量的评价还有待进一步深入的研究.另一方面,计算机视觉是模仿人的视觉,人的感知机理必然影响着计算机视觉的研究,这些都是心理学和神经心理学正在着力研究的课题.
1.2数字图像处理的优点
(1)再现性好.数字图像处理与模拟图像处理的根本不同在于,它不会因图像的存储、传输或复制等一系列变换操作而导致图像质量的退化,只要图像在数字化时准确地表现了原稿,则数字图像处理过程始终能保持图像的再现.(2)处理精度高.按目前的技术,几乎可将一幅模拟图像数字化为任意大小的二维数组,现代扫描仪可以把每个像素的灰度等级量化为16位甚至更高,这意味着图像的数字化精度可以达到满足任一应用需求.(3)适用面宽.图像可以来自多种信息源,从图像反映的客观实体尺度看,可以小到电子显微镜图像,大到航空照片、遥感图像甚至天文望远镜图像.这些来自不同信息源的图像只要被变换为数字编码形式后,均是用二维数组表示的灰度图像组合而成,因而均可用计算机来处理.(4)灵活性高.数字图像处理不仅能完成线性运算,而且能实现非线性处理,字图像处理实现.
1.3数字图像处理过程
由于数字图像处理的灵活性和方便性,理已成为图像处理的主流.:采集、数字化、编码、增强、、分
析、识别、分割等,.
(1)图像数字化.在的图像变换为适合计算机处理的数字形式,图像在计算机
内部被表示为一个数字矩阵,矩阵中每一元素称为像素.图1 数字图像处理流程图
(2)图像的编码.编码的目的是压缩图像的信息量(但图像质量几乎不变),以满足传输和存储的要求,为此,可以采用模拟处理技术,再通过模-数转换得到编码,不过多数是采用数字编码技术,其编码方法可以对图像逐点进行加工,也可以对图像施加某种变换或基于区域、特征进行编码.(3)图像增强.图像增强目的是使图像清晰或将其转换为更适合人或机器分析的形式,常用的图像增强方法有:灰度等级直方图处理;干扰抵制;边缘锐化;伪彩色处理.(4)图像恢复.其目的是除去或减少在获得图像过程中因各种原因产生的退化,可能是光学系统的像差或离焦、摄像系统与被摄物之间的相对运动、电子或光学系统的噪声和介于摄像系统与被摄像物间的大气湍流等.(5)图像分割.将图像划分为一些互不重叠的区域,每一区域是像素的一个连续集.通常采用把像素分入特定区域的区域法和寻求区域之间边界的境界法.这2种方法都可以利用图像的纹理特性实现图像分割.(6)图像分析.从图像中抽取某些有用的度量、数据或信息,其目的是得到某种数值结果.图像分析的内容和模式识别、人工智能的研究领域有交叉,但图像分析与典型的模式识别有区别.图像分析需要用图像分割方法抽取出图像的特征,然后对图像进行符号化的描述,这种描述不仅能对图像中是否存在某一特定对象作出回答,还能对图像内容作出详细描述.
图像处理的各个内容是互相有联系的.一个实用的图像处理系统往往结合几种图像处理技术才能得到所需要的结果,图像数字化是将一个图像变换为适合计算机处理的形式的第1步,图像编码可用以传输和存储图像.图像增强和复原可以是图像处理的最后目的,也可以是为进一步的处理作准备.通过图像分割得出的图像特征可以作为最后结果,也可以作为下一步图像分析的基础.
2 数字图像处理的主要研究进展
2.1数字图像的采集与数字化
图像的采集是数字图像处理的第1步,采集并不局限于对人眼视觉功能的模仿,更是对人类认识、分析手段的拓展.在医学、天文学、自动字体识别、机器视觉、军事识别、指纹自动处理和血样分类处理等多个方面都不同程度地运用了图像提取技术.图像提取技术源自于电影和视频产品的发展[4].其中,最具影响力的研究是由Porter和Duff提出的通道概念[5],对图像提取技术的离散特性进行了规范,为这一研究领域奠定了基础,使其成为图像处理领域一个较独立的重要分支.20世纪60年代,由于当时的图像提取技术还未成形,人们主要依赖于用拍摄技巧弥补后期制作的不足.随着当时计算机应用的发展,图像处理技术获得了更加广阔的发展空间,各种各样的处理技术和方法也相应而生.如四元组像素的提出以及Blinn对
数字图像处理技术的现状及其发展方向_陈炳权
第1期 陈炳权,等:数字图像处理技术的现状及其发展方向 65 计算机领域所运用到的像素进行的全面诠释[6].20世纪90年代初期,学者们逐渐认识到要实现信息的精确提取是非常困难和费时的,对于稍复杂的图像或视频,其代价十分巨大.所以学者们开始考虑借助数学和概率统计学的原理来寻求更优解,而不再强调最优解.
图像提取技术的发展过程经历了以下4个发展阶段:(1)萌芽阶段.通过拍摄时的布景实现提取条件.(2)初期阶段.以四元像素和数字化为基础,建立了独立的分支学科.(3)飞跃阶段.以概率统计学原理为基础的提取.(4)分化阶段.认识到视频中帧与帧之间存在相关性,产生了专门用于视频提取的方案.但由于自然色彩分布的复杂性,至今没有被广泛认可的模型,也没有系统的、统一的评价标准.所以说,图像提取技术的成熟还有待时日,并依赖于其它学科及计算机硬件技术的发展.由于图像提取涉及的学科领域比较广泛,学者们对待该问题的研究角度和出发点各不相同,目前已有的概念和模型有:Porter&Duff模型[5],Blinn模型[6],Knockout模型[7],Ruzon&Tomasi模型[8],Bayesian模型[9],Poisson模型[10],Chuang&Agarwala模型[11],YinLi&JianSun模型[12],比较分析上述模型,可以发现:Porter&Duff模型、Blinn模型将图像提取问题规范化,是后续研究的重要基础;Knockout模型是对Porter&Duff模型、Blinn模型的有益扩展,使之实用意义更大,在实际运用中效率更高.虽然Ruzon&Tomasi模型、Bayesian模型、Poisson模型采用的具体概率统计方法各异,但这些模型都是先对图像进行初始化,生成Trimap———前景、背景、交界区域,研究对象都是交界区域的α值.[13]Chuang&Agarwa2la模型、YinLi&JianSun模型以视频提取为研究目的,引人了帧间信息相关性的概念,实现了视频的半自动提取..
目前为止,图像提取技术根据需求的不同出现了2种研究思路:一种更注重提高α值的精确度,追求精确完美的效果;另一种则更注重提高提取的效率、实时性及自动化程度.目前,5个方面:(1)拍摄设备、拍摄方法及技巧;(2)分割技术;(3)人机交互操作接口;(4);(模型.
2.2图像压缩编码
作为通信、介质存贮、数据发送、关键环节,研究领域之一.电子技术和通信技
术的发展使可视电话、、数字电视、高清晰度电视、
多媒体计算机、信息高速公路等的生产和建立成为可能.在
这一背景下,探索高效图像压缩编码算法无疑将成为主要任
务之一,对其研究也将成为国际公认的热点之一.[14]为了使图2 图像压缩系统模型
有限的符号表达更多的信息量,图像压缩既非常必要,也有可能,因此产生了各种各样的图像压缩方法.图像压缩编码用尽可能少的数据表示信源发出的图像信号,以减少容纳给定消息集合的信号空间.通过对图像数据的压缩减少数据占用的存储空间,从而减少传输图像数据所需的时间和信道带宽.图2为图像压缩系统模型,图像压缩编码算法的研究历程可分为如下2个阶段.
(1)第1代图像压缩编码阶段(1985年以前).图像压缩编码算法的研究起源于传统的数据压缩理论,有些学者认为始于18世纪末Sheppards所做的“实数舍入为十进制数”的研究,也有人认为19世纪末研制的莫尔斯代码是数据压缩的第一次尝试.1939年Dudley研制了声码器,他把声音频谱的能量划分为有限数目的频带,并且在每个频带内传输相应的能级,因此能够达到较高的压缩.比较系统的研究始于20世纪40年代初形成的信息论,尽管当时数字计算机尚未出现,但其研究与当今数字计算机所使用的压缩技术有着密切的联系,许多算法,如Huffman编码等仍有很大的应用价值.近年来,由于模式识别、图像处理、计算机视觉等技术的发展,促进了数据压缩的研究.1997年以前基于符号频率统计的Huffman编码具有良好的压缩性能,一直占据重要的地位,并不断有基于其改进的算法提出[15-16].1977年以色列科学家JacobZiv和Abra2hamLempel提出了不同于以往的基于字典的压缩编码算法LZ77,1978年又推出了改进算法LZ78,把无损压缩编码算法的研究推向了一个全新的阶段.近年来,随着神经网络理论的兴起,有人采用BP网进行非线性预测的尝试,取得了较好的效果[16].自1969年在美国举行首届“图像编码会议”以来,图像压缩编码算法的研究有了很大进展,其中变换压缩编码[16-17]与量化压缩编码[18-20]是研究热点.
(2)第2代图像压缩编码阶段(1985年以后).为了克服第1代图像压缩编码存在的压缩比小、图像复原质量不理想等弱点,1985年Kunt等人充分利用人眼视觉特性提出了第2代图像压缩编码的概念.20世纪80年代中后期,人们相继提出了在多个分辨率下表示图像的方案[21],主要方法有子带压缩编码、金字塔压缩编码等,利用不同类型的线性滤波器,将图像分解到不同的频带中,然后对不同频带的系数采用不同的压缩编码方法.这些方法均在不同程度上有如下优点:多分辨率的信号表示有利于图形信号的渐进式传输;不同分辨率的信号占用不同的频带,便于引入视觉特性.1988年,Barnsley和Sloan共同提出了分形图像编码压缩方案[22],该方案利用图像中固有的自相似性来构造一个紧缩变换,并使原图像成为该紧缩变换的吸引子,编码时只需存储变化的参数,解码时需要利用该变化对任一幅图像不断进行迭代变换.此方案具有思路新颖、压缩潜力大、解码分辨率无关性等特点,是一种很有潜力的编码方法[23-24].1987年,Mallat首次巧妙地将计算机视觉
数字图像处理技术的现状及其发展方向_陈炳权
66 吉首大学学报(自然科学版)第30卷领域内的多尺度分析思想引入到小波变换中,统一了在此之前的各种小波的构造方法.之后,他又研究了小波变换的离散形式,并将相应的算法应用于图像的分解与重构中,为随后的小波图像压缩编码奠定了基础.进入90年代,又取得了一系列图像压缩编码研究的阶段性新成果[25-26].其中EZW编码算法[27]、SPIHT编码算法[28]被认为是目前世界上比较先进的图像压缩编码算法,这2种算法均具有结构简单、无需任何训练、支持多码率、图像复原质量较理想等优点,但同时又都不同程度地存在算法时间复杂度和空间复杂度过高的弱点.而小波变换的图像压缩编码算法已成为目前图像压缩研究领域的一个主要方向.小波变换是20世纪80年代后期发展起来的一种新的信息处理方法,因其本质是多分辨分析信号,在时域和频域都具有分辨率,对高频分量采用逐渐精细的时域或空域步长,可以聚焦到分析对象的任意细节,对于剧烈变换的边缘,比常规的傅里叶变换具有更好的适应性,故特别适用于分析非平稳信号.
2.3图像增强与恢复
图像增强是按照特定的要求突出一幅图像中的某些信息,同时削弱或去除某些不需要的信息处理方法,其主要目的是使处理后的图像对某种特定的应用来说,以原来图像更适用,它是为了某种应用目的去改善图像质量,使图像更适合于人的视觉特性或机器的识别系统.目前增强方法主要有直方图修改处理、图像平滑化处理、图像尖锐化处理及彩色处理技术等[29],由于各种图像增强算法的特点不同,对图像增强的侧重点也不同.在对图像进行处理之前,首先分析不同图像增强方法的优缺点,再对具体图像问题进行具体分析,然后选择几种增强方法结合使用,也许就可能达到预期的增强效果.
图像在获取、传输和存储过程中由于受多种原因如模糊、失真、噪声等的影响,会造成图像质量的下降,即图像的退化.引起图像退化的原因很多,在图像的获取(数字化过程)和传输过程,如使用CCD,光照程度和传感器温度是造成图像退化的主要因素..图像恢复技术以获取视觉质量得到某种程度改善为目的,化图像进行恢复,以获取到原始的、/复原模型,当不知道图像本身的性质时,可以建立退化源的数学模型,.当有了关于图像本身的先验知识时,模型以建立原始图像的模型,.常见的图像恢复模型有4种:通用图像模型,光学系统模型,,.[30]在成像系统中一个通常的缺点是在传感器和显示器系统中存在有害的非线性,[29].这种恢复处理实现起来通常相对简单,最常见的图像恢复任务是为了补偿图像模糊和消除噪声影响而进行的空间图像恢复.[30-31]目前通常有以下恢复技术:传感器和显示点的非线性修正,连续图像的空间滤波恢复,伪逆空间图像恢复,SVD伪逆空间图像恢复,统计学估计空间图像恢复,约束图像恢复,盲目图像恢复.[31]
2.4图像分割
图像分割是图像处理中的一项关键技术,自20世纪70年代起一直受到人们高度重视,并在医学、工业、军事等领域得到了广泛应用.常用的分割方法主要分为基于区域的分割方法和基于边缘的分割方法2类.此外,随着各学科的发展出现了一些结合某种特定理论的分割方法.
2.4.1基于区域的分割方法 这类方法的基本思想是将图像分割成若干不重叠的区域,使各区域内部特征的相似性大于区域间特征的相似性,各区域内像素都满足基于灰度、纹理等特征的某种相似性准则.其常见的方法:阈值法[32];区域生长法
[33];分裂合并法[33].
2.4.2基于边缘的分割方法 边缘的主要表现为图像局部特征的不连续性,该方法首先检出图像中局部特性的不连续性或突变性,然后将它们连成边界,这些边界把图像分成不同的区域.传统的图像边缘检测方法大多可归结为图像高频分量的增强过程,微分运算自然成为边缘检测与提取的主要手段.常用的边缘检测算子有以下几种:Robert算子、Sobel算子、Pre2witt算子、Canny算子和拉普拉斯算子.微分算子法[34]的优点是计算简单、速度较快,缺点是对噪声的干扰都比较敏感.边界跟踪法[35]的基本思想是从梯度图中的一边缘点出发,依次搜索并连接相邻边缘点,从而实现对图像边界的检测,先确定搜索起点,接着采取合适的数据结构和搜索机理,并在已发现的边界点上确定新的边界点,最后按照搜索的终结准则和终结条件完成边界的跟踪,从而实现边缘的提取.
图像分割至今尚无通用的自身理论,随着各学科的不断发展,提出了许多新理论和新方法,于是出现了许多与一些特定理论、方法相结合的图像分割技术.遗传算法[36]最初由美国Michigan大学的Holland教授于1975年提出的,其基本思想是将问题域中的可能解视为群体的一个个体或染色体,并将每一个体编码成符号串形式,对种群反复进行选择、交叉和变异操作,根据预定的目标适应度函数对每个个体进行评价,适应值高的染色体被选中概率较高,以全局并行搜索方式来搜索优化群体中的最优个体.该方法具有全局搜索能力,是一种迭代式的优化算法,在分割图像时常用来帮助确定最佳分割阈值.小波变换[37]是在傅里叶分析基础上发展起来的,具有良好的时域和频域局部化特性,而且还具有多分辨分析的特点.基于小波分析的边缘检测方法[37]的突出优点是它的多尺度性,图像的每个尺度的小波变换都提供了一定的边缘信息.小尺度下,图像的边缘细节信息丰富,边缘定位精度较高,但易受噪声干扰,大尺度下,边缘稳定,抗噪性好,但定位精度差.利用小波的多尺度性可实现在大尺度下抑制噪声,可靠地识别边缘,在小尺度下精确定位.Snake模型[38]最初是由Kass等人在1987年
数字图像处理技术的现状及其发展方向_陈炳权
第1期 陈炳权,等:数字图像处理技术的现状及其发展方向 67 第1届计算机国际视觉会议上提出的,其基本思想是首先通过人的识别能力,在图像中目标边界附近确定初始轮廓线,然后对曲线进行能量最小化变形,使其锁定在待分割目标的边界上.Snake算法能够有效地利用图像局部与整体的信息,实现对边界的准确定位,具有良好的提取和跟踪特定区域内目标轮廓的能力.由于图像的千变万化,在实际应用中,通常将多种分割算法有效地结合在一起使用以获得更好的分割效果.
2.5图像分析
图像分析从图像中抽取某些有用的度量、数据或信息,目的是得到某种数值结果,它主要是提供关于被分析图像的一种描述,既要利用模式识别技术,又要利用关于图像内容的知识库,即人工智能中关于知识表达方面的内容.图像分析需要用图像分割方法抽取出图像的特征,然后对图像进行符号化的描述,这种描述不仅对图像中是否存在某一特定对象作出回答,还要对图像内容作出详细描述.图像分割综述已上述所述,现分别从描绘和纹理分析这2个方面加以阐述.
2.5.1图像描绘 经过图像分割后,得到的是若干区域和边界.为了有效地识别目标,必须要描述这些目标即提供它们的有用信息和相互关系,通常有区域内部描述、区域边界描述和关系描述.(1)区域内部描述.(i)矩描述子.该描述子是基于帕普里斯(Papoulis)唯一性定理.MKHu在1961年首先提出不变矩的概念,并将几何矩用于图像描述.MRTeague在1979年基于正交多项式理论提出的Zernike矩,从噪声灵敏度、信息冗余度和图像描述能力等方面来说都具有很好的性能.YLSheng和LXShen于1994年提出了正交傅里叶梅林矩[39],平子良等定义了一种新的图像矩———切比雪夫图像矩描述图像[40],这种矩可以得到比较理想的描述效果.矩方法是一种经典的区域形状分析方法,,缺乏实用价值.(ii)拓扑描述子[41].带有孔的图形,如果把区域中的孔洞数作为拓扑描述子变换的影响.但是如果撕裂或折叠时,孔洞数就要变化了,.(iii)投影与截痕.,的对象方向特性的参数是截痕,).[41](.(i)傅里叶描述子.当一个区域边界上的点已被确定时,,Kauppien].通过连续型,可以减少由于边界曲线等间距离散化引起的误差,而且可以大大减少傅里叶变换计算的工作量.[43](ii.小波变换是一一对应的映射,所以一个给定的轮廓对应一组唯一的描述符.小波轮廓描述符比较适合描述轮廓的基本特征并用来进行基于轮廓的图像检索.从描述精度、稳定性各方面来看,它比傅里叶描述子更为优越.(iii)霍夫变换.霍夫(Hough)变换是一种线描述方法,它可以将笛卡尔坐标空间的线变换为极坐标空间的点,霍夫变换使不同坐标系中的线和点建立了一种对应关系.(iiii)曲线拟合.任何一个二维图像目标或对象的边界都是平面中的一条曲线.对曲线拟合一个函数可用于描述该目标的边界(形状).对于所拟合函数,总存在一定的拟合误差.Duda和Hart提出一种简单的分段线性曲线拟合方法,即重复端点拟合方法,这种方法类似于采用分裂方法逼近多边形边界的技术.该方法的优点是计算简单,缺点是噪声数据点将引起拟合误差.多数情况下,拟合后的曲线只是一种近似,可借助许多方法进行调整,以使边界更加精确,其中利用高层知识的处理也是常用的方法.另外,Ho-KeunSong和Eung-KwaKang提出了用圆形扫描的方法来描述图像.(3)关系描述.关系描述的任务就是把被分割后的区域或部分组成为有意义的关系结构,一般是以文法概念为基础的,通常可分为串文法和高维文法,其中高维文法又包括树文法、网文法、表结构[44].
2.5.2纹理分析 结构法、统计法、频谱法和模型法是常用的纹理研究方法.结构法从纹理的基元形态及其排布规则角度分析,适用于研究规则纹理;统计法从宏观角度对纹理进行统计分析,适用于随机纹理;频谱法利用频域信号处理方法分析纹理的数字特征;模型法将纹理看做某种数学模型进行分析.(1)结构法.结构分析法从纹理图像的结构角度分析纹理基元形状和排列分布特征.纹理基元存在面积、周长、偏心度、方向、延伸度、欧拉数、矩、幅度、紧支性等特征.该方法通常首先确定纹理基元,然后根据句法模式识别理论,利用形式语言对纹理的排列规则进行描述.其优点是有利于对纹理构成的理解和高层检索使用,适合于描述人工规则纹理.对于自然纹理,由于基元本身提取困难以及基元之间的排布规则不易用确定的数学模型描述,在随机纹理的描述方法中,结构分析法应用不多或者常被用做辅助分析手段.(2)统计法.多数纹理可以描述为一个随机变量,尤其是自然纹理,从局部分析表现出很大的随机性.从整体分析和统计意义上,纹理存在某种规律性,不同的纹理存在不同的数字特征.基于统计的纹理分析方法主要有矩、自相关函数、灰度共生矩阵分析等.(3)频谱法.频谱法将空间域的纹理图像变换到频率域中,利用信号处理的方法,该法是建立在多尺度分析与时/频分析基础之上的纹理分析方法,目前主要有傅里叶变换、小波等.(4)模型法.模型法将纹理基元分布看成某种数学模型,运用统计、信号分析等理论中相应的方法对纹理模型进行分析,获得一些纹理特征.常用的模型有马尔可夫随机场模型[45]、Wold分解[46]、自回归模型[47]、控向金字塔[48]小波分析、分形[49]等.基于模型的方法不仅可以用于表示纹理,而且可以用于合成纹理.
3 存在的问题和未来的方向
图像提取技术得到了越来越多学者的关注,产生了很多的研究成果,但是仍存在以下4点不足和有待解决的问题:(1)缺乏统一的评价标准;(2)缺乏先验知识来支持系统;(3)最终提取边界很大程度上依赖于Trimap;(4)图像提取系统的计算
数字图像处理技术的现状及其发展方向_陈炳权
68 吉首大学学报(自然科学版)第30卷量都比较大.图像提取技术研究作为图像处理中一个重要研究分支,引人大量概率统计理论,目前图像提取技术领域的研究依然非常活跃.如华盛顿大学专门成立了图形图像实验室(GRAIL,),由SONY等企业联合一些大学也进行了相关的研究[50],Microsoft在其亚洲微软研究院(MRA)专门设有图形图像处理技术研究所和交互可视媒体研究组[51],北京大学、浙江大学等都相继成立了从事数字图像处理技术研究的国家重点实验室[52].天津大学从研制数字电视及电影制作设备(如切换台等)的角度,也对图像提取技术进行了较深人的研究.笔者认为:前景与背景间交界区域估计模型仍是该领域研究的一个重点.小波变换图像压缩编码有待解决的主要问题:尽管小波变换图像压缩编码算法具有结构简单、无需任何训练、支持多码率、压缩比较大、图象复原质量较理想等特点,但在不同程度上存在压缩/解压缩速度慢、图像复原质量不理想等问题,为了进一步改善此算法的工作效率,需要解决以下2个主要问题:正交小波基的选择问题;数据向量量化编码算法的选择问题.纹理的理论和应用研究取得了丰富的成果,但也有一些与之相关的概念和理论尚未取得一致的看法,纹理研究方法多从信号处理、模式识别理论发展而来,并且处在不断的发展之中.
经过近90年的发展,特别是第3代数字计算机问世后,数字图像处理技术出现了空前的发展,但存在一定的问题,具体体现在以下5个方面:(1)在提高精度的同时着重解决处理速度的问题,巨大的信息量和数据量和处理速度仍然是一对主要矛盾;(2)加强软件的研究和开发新的处理方法,重点是移植其他学科的技术和研究成果;(3)边缘学科的研究(如人的视觉特性、心理学特性的研究的突破)促进图像处理技术的发展;(4)理论研究已逐步形成图像处理科学自身的理论体系;(5)建立图像信息库和标准子程序,统一存放格式和检索.图像信息量和数据量大,若没有图像处理领域的标准化,图像信息的建立、检索和交流将是一个极严重的问题,交流和使用极不便,造成资源共享的严重障碍.
笔者认为,图像处理技术未来发展大致体现在在以下4个方面)、多媒体、智能化和标准化方向发展.具体表现:(1)提高硬件速度.;(2)提高分辨率.主要是提高采集分辨率和显示分辨率,;(3)立体化.图像是二维信息,.(4)多媒体化.20世纪90年代出现的多媒体技术,,而且还在发展,它将朝着人类接收和处.,能够考虑到主观概率和非逻辑思维.(6)标准化.从整体上看,图像处理技术目前还没有国际标准.2)图像和图形相结合朝着三维成像或多维成像的方向发展.3)硬件芯片的开发研究.目前结合多媒体的研究,硬件芯片越来越多,如Thomson公司ST13220采用Systolic结构设计了运动预测器,把图像处理的众多功能固化在芯片上,为实践服务.4)新理论和新算法的研究.图像处理科学经过初创造期、发展期、普及期和广泛应用期,近年来引入了一些新的理论并提出了一些新的算法,如:Wavelet、Fractal、Mor2phology、遗传算法和神经网络等,其中Fractal广泛应用图像处理、图形处理、纹理分析,同时还用于物理、数学、生物、神经和音乐等方面.
参考文献:
[1] http://puterTechniquesinImageProcessing[M].NewYork:AcademicPress,1970.
[2] PRATTK.DigitalImageProcessing[M].NewYork:JohnWiley&Sons,1978.
[3] O‘HANDLEYDA,GREENWB.RecentDevelopmentinDigitalImageProcessingattheImageProcessingLaboratory
attheJetPropulsionLaboratory[J].Proc.IEEE,1972,60(7):821-828.
[4] FIELDINGR.TheTechniqueofSpecialEffectsCinematography(ThirdEdition)[M].London:Focal/Hastings
House,1972.
[5] PORTERT,http://positingDigitalImages[J].ComputerGraphics(ACM),1984,18(3):253-259.
[6] http://positing,Part1:Theory[J].IEEEComputerGraphics&Application,1994,14(6):78-82.
[7] BERMANA,DADOURIANA,VLAHOSP.MethodforRemovingFromonImagetheBackGroundSurroundingaSe2
lectedObject[P].U.S.Patent6-134-345,2000.
[8] RUZONMA,TOMASIC.AlphaEstimationinNaturalImages[A].ProceedingsoftheIEEEComputerSocietyCon2
ferenceonComputerVisionandPatternRecognition1[C].NewYork:Wiley&IEEEPublishing,2000:18-25.
[9] CHUANGYY,CURLESSB,SALESINDH,etal.ABayesianApproachtoDigitalMatting[A].Proceedingofthe
IEEEComputerSocietyConferenceonComputerVisionandPatternRecognition2[C].NewYork:Wiley&IEEEPublishing,2001:264-271.
[10] SUNJ,JIAJY,TANGCK,etal.PoissonMatting[J].ACMTransactionsonGraphics,2004,23(3):315-321.
[11] DUZL,LINH,QINXY,etal.OrientedPoissonMatting[A].ICIP2005IEEEInternationalConferenceonImage
Processing[C].NewYork:Wiley&IEEEPublishing,2005:11-14.
数字图像处理技术的现状及其发展方向_陈炳权
第1期 陈炳权,等:数字图像处理技术的现状及其发展方向 69
[12] LIY,SUNJ,SHUMHY.VideoObjectCutandPaste[J].ACMTransactionsonGraphics,2005,24(3):595-600.
[13] LINSY,SHIJY.FastNaturalImageMattinginPerceptualColorSpace[J].Computer&Graphics,2005,29:403-
414.
[14] 王向阳.基于小波变换的有损图像压缩算法研究[J].计算机工程与应用,2001,37(15):82.
[15] WITTENIH,NEALR,CLEARYJ.ArithmeticCodingforDataCompression[J].CommunicationsoftheACM,
1987,30(6):520-540.
[16] RABBANIM,JONESP.DigitalImageCompressionTechniques[J].SPIE,1991(1450):116-128.
[17] EPSTEINBR,HINGORANIR.MultispectralKLT2WaveletDataCompressionforLandsatThermaticMapperIma2
ges[J].DataCompressionConf.,1992(13):181-190.
[18] NASRABADINM,KINGRA.ImageCodingUsingVectorQuantization:aReview[J].IEEETrans.onCommun.,
1988,36(8):957-971.
[19] GUANL,KAMELM.AVectorDistributionModelandanEffectiveNearestNeighborSearchMethodforImage
VectorQuantization[J].IEEETrans.onImageProcessing,1997,6(12):1688-1691.
[20] RINALDOR,CALVAGNOG.HibirdVectorQuantizationforMultiresolutionImageCoding[J].IEEETrans.on
ImageProcessing,1997,6(5):753-758.
[21] WOODSJW,O’NEILSD.SubbandCodingofImages[J].IEEETrans.onAcousticandSignalProcessing,
1986,34(5):1278-1288.
[22] BARNSLEYMF,SLOANAD.ABetterWaytoB,1988,13(1):215.
[23] JACQUINAE.ImageCodingBasedonaImageTransformations[J].IEEE
Trans.onImageProcessing,1992)-30.
[24] WOHLBERGB,JAforFirst2OrderGauss2MarkovModels[J].ElectronicsLet2
ters,1996(32)-[25] ANTONINIMM,MATHIEUP,etal.ImageCodingUsingWaveletTransform[J].IEEETrans.onIm2
ageProcessing,1992,1(2):205-220.
[26] AVERBUCHLAZARD,ISRAELIM.ImageCompressionUsingWaveletTransformandMultiresolutionDecomposi2
tion[J].IEEETrans.onImageProcessing,1992,5(1):4-15.
[27] SHAPIROJM.EmbeddingImageCodingUsingZerotreesofWaveletCoefficients[J].IEEETrans.onSignalPro2
cessing,1993,41(12):3445-3462.
[28] BRANCAA,TAFURIM,ATTOLICOG.DirectionalityDetectionIncompositionalTextures[C]//Proc.ofthe13th
InternationalConferenceonPatternRecognition.1996(15):830-834.
[29] BORNM,WOLFE.PrinciplesofOptics[M].NewYork:PergamonPress,1999.
[30] GOODMANJW.IntroductiontoFourierOptics[M].NewYork:McGraw2Hill,1996.
[31] HENNEYK,DUDLEYB.HandbooksofPhotography[M].NewYork:McGraw2Hill,1939.
[32] 容观澳.计算机图像处理[M].北京:清华大学出版社,2000.
[33] 陈武凡.小波分析及其在图像处理中的应用[M].北京:科学出版社,2002.
[34] 季 虎,孙即祥,邵晓芳,等.图像边缘提取方法及展望[J].计算机工程与应用,2004(14):70-73.
[35] 柳稼航,杨建峰,单新建,尹京苑.一种基于优先搜索方向的边界跟踪算法[J].遥感术与应用,2004,19(3):209-
213.
[36] 周 铭,周 惠.基于遗传算法的自适应聚类图像阈值分割方法[J].计算机工程与应用,2005,18:73-76.
[37] 成金勇,范延滨,宋 洁,等.基于小波分析与Snake模型的图像边缘检测方法[J].青岛大学学报:自然科学版,2005
(3):78-81.
[38] KASSM,WITKINA,TERZOPOULOSD.Snake:ActiveContourModels[J].InternationalJournalofComputerVi2
sion,1987,1(4):321-331.
[39] 严蔚敏,吴伟民.数据结构[M].北京:清华大学出版社,1998.
[40] 张宏林.VisualC++数字图像模式识别技术及工程实践[M].北京:人民邮电出版社,2003.
[41] SAIDA,PEARLMANWA.ANewFastandEfficientImageCodeBasedonSetPartitioninginHierarchicalProcess2
ing[J].IEEETrans.onCircuitsandVideoTechnology,1996,6(3):243-250.
[42] KAUPPIENH,SEPANENT.AnExperimentComparisoofAutoregressiveandFourier2BasedDescriptorsIn2D
ShapeClassification[J].IEEETrans.onPAMI,1995(2):201-207.
数字图像处理技术的现状及其发展方向_陈炳权
70 吉首大学学报(自然科学版)第30卷
[43] 王 涛,刘文印.傅里叶描述子识别物体的形状[J].计算机研究与发展,2002(12):1714-1719.
[44] 严蔚敏,吴伟民.数据结构[M].北京:清华大学出版社,1998.
[45] CROSEGR,JAINAK.MarkovRandomFieldTextureModels[J].IEEETrans.onPatternAnalysisandMachine
Intelligence,1983,5(1):25-38.
[46] FRANCOSJM,MEIRIAZ,PORATBA.UnifiedTextureModeBasedona2DWold2LikeDecomposition[J].IEEE
Trans.onSignalProcessing,1993,41(8):2665-2678.
[47] MAOJian2chang,JAINAK.TextureClassificationandSegmentationUsingmultiResolutionAutoregressiveModels
[J].PatternRecognition,1992,25(2):173-188.
[48] FREEMANWT,ADELSONEH.TheDesignandUseofSteerableFilters[J].IEEETrans.onPatternAnalysisand
MachineIntelligence,1991,13(9):891-906.
[49] 李水银,吴纪桃.分形与小波[M] 北京:科学出版社,2002.
[50] MITSUNAGET,YOKOYAMAT,TOTSUKAT.AutokeyHumanAssistedKeyExtraction[A].Proceedingsofthe
ACMSIGGRAPHConferenceonComputerGraphics[C].NewYork:ACMPress,1995:265-275.
[51] ZITNICKCL,KANGSB,UYTTENDAELEM,etal.High2QualityVideoViewInterpolationUsingaLayeredRep2
resentation[J].ACMTransactionsonGraphics,2004,23(3):600-608.
[52] 中华人民共和国科学技术部.国家重点实验室一览[OL].http://www.Chinalab.site/specialTopic.
aspx?type=国家实验室专栏,2007-05-12.
Directionof
ProcessingTechnology
CHENBing2quan1,2,LIUHong2li1,MENGFan2bin2
(1.CollegeofElectricandInformationEngineering,HunanUniversity,Changsha410082,China;2.Collegeof
PhysicsScienceandInformationEngineering,JishouUniversity,Jishou416000,HunanChina)
Abstract:Themajorpropertiesofdigitalimageprocessingtechnologyarereviewed,includingtheproduc2tionanddevelopmentofimagecollectionanddigitalization,imagecompression,imageenhancementandreconstruction,imagesegmentationandimageanalysis.Basedonthelatestdevelopmentinthisfield,thehighlightsinthedevelopmentofthoseaspectsareintroduced.Thus,thechallengeanddevelopmentdivec2tionofdigitalimageprocessingtechnologyaresummarized.
Keywords:imagedigitalization;imagecompression;imagesegmentation;imageenhancementandrecon2struction;imageanalysis;currentsituationanddevelopmentdirection
(责任编辑 向阳洁)