676 Journal of Software 软件学报 2003,14(3) 颜色或纹理等特征,而视频检索是在视频序列库中查找特定的连续帧,还需要分析连续帧间的相关特征.
基于样本的视频检索是根据用户提交的视频样本,在数据库中查找与之相似的视频片断(clip),其基本思想是先提取视频样本的某些特征,然后根据与各视频片断比较的相似度得到检索结果.与其他视频分析,例如镜头分割和关键帧提取一样,可将检索方法分为两类:一类是在像素域中分析连续帧的颜色或对象边界等特征,以前大多数方法属于此类,进展相对较快;另一类是在压缩域中直接分析DC系数或光流场等特征,对这类方法的研究较少,因为无须对压缩视频完全解码,需要较少的运算量,这对大型视频数据库检索和实时检索是非常有益的.另外,当前方法不加区分地对明显不同和基本相似的片断采用统一的匹配算法,事实上大部分片断只需简单分析就可判定不相似,而对相似度较高的片断则需精确分析,但很少有方法考虑到这一点.文献[4,5]对当前的主要检索方法进行了综述.
本文提出一种基于样本的分级检索MPEGⅠ或MPEGⅡ(下文统称为MPEG)视频的新方法,同时对原有的I帧dct_dc_size字段的分析算法进行了改进,用断层摄影法分析运动矢量的时空分布特性.
1 分级检索的原理和方法
1.1 分级检索方法概述
与文本数据不同,视频数据有不同的相似性评价标准,所选取的比较特征的优劣决定了算法的性能,它的主要评价标准是其计算存储代价和对不同视频的区分性.本文选取的比较特征是以MPEG原始码流中存在的字段为基础的,无须复杂变换,且具有较好的区分性.
在视频数据库中,与样本相似的视频仅是一小部分,不必对所有片断进行精确比较,只需分析I帧中表示DC差值编码长度的dct_dc_size字段就可以过滤与样本有较大差异的片断,这样的快速粗检是分级检索的第1级,然后用断层摄影(tomography)法分析B帧运动矢量的时空分布特性以进行精确分析,最后用DC图像精确匹配法对结果进行验证.
1.2 分析I帧的dct_dc_size字段快速粗检
MPEG标准规定[6],每个图像组GOP中存在一个I帧,I帧主要包含DCT变换后的直流系数DC和交流系数AC,可独立解码.DC值与原8*8矩阵元素的平均值成正比,它是视频分析的一个重要特征.MPEG码流中存在的并不是DC的实际值,而是相邻块间的DC差值,当前块的DC值等于参考块的DC值加上当前块的DC差值,MPEG标准规定了参考值为0时的情况,例如在每个组块(slice)开始处,其主要目的是增大压缩比例.图1给出宏块(i,j)内部4个亮度块间的参考示意图,其中数字和箭头表示参考顺序,其他字符意义将在下文给出.
Fig.1 DC value reference mode of the four blocks in macroblock (i,j)
图1 宏块(i,j)内部4个亮度块间的参考示意图
每个块的DC差值是与预测块间的亮度差或色度差的平均值成正比的,相似视频对应的DC差值也必相似.同DC值一样,DC差值也是视频分析的重要特征.在MPEG码流中,用dct_dc_size字段表示DC差值的编码长度,差值越大,编码长度越大,相应的dct_dc_size字段也就表示差值的取值范围.以前对此特征研究较少,仅检索