MPEG-动态图像专家组
目前的视听标准是为从照相机和麦克风获取的自然内容的编码重现而设计的。由于上述三个领域的相互渗透,人工内容的应用在不断增长。因此,很显然的需求是一种既适合于自然对象又适合于人工对象的模式,它能够用来产生单一的音像序列。 MPEG功能
a.新的或改进的功能
下述8个关键的功能是MPEG-4新的特点,可以认为现存的或其他正在制定的标准不能完全支持MPEG-4,这些功能由编码工具和MSDL的组合来支持。当特定应用需要时,灵活的MSDL允许使用不同的编码工具来提供这些功能的不同组合。
这些功能如表1所述,在表1中根据它们是否涉及基于内容的交互性、压缩比或通用访问能力进行了分组。
b.其他标准的功能
除上述新的或改进的功能外,还有几种其他的重要功能,需要用它来支持已预见到的音频应用。与新的或改进的功能所不同的是,下面所列的功能已由现行的或其他正在制定的标准提供。
1、同步———对所表示的音频、视频和其他内容数据进行同步的能力;
2、辅助数据能力———为二进制数据比特流分配通道的能力;
3、虚拟通道分配的灵活性———动态地重新分配视频、音频或数据通道的能力;
4、低延迟模式(端对端或解码器)———对系统、音频和视频编码进行低延迟操作的能力;
5、用户控制———支持交互操作中用户控制的能力;
6、传送媒体交互运作———在各种媒体上进行运作的能力;
7、与其他音像系统的交互运作———与各种类型的终端相互作用的能力;
8、多点能力———具有多源或多目的地的能力;
9、安全———提供密码、鉴别和密钥管理的能力;
10、内容———对各种类型的可视画面和音频内容进行编码的能力(高的和中等质量的音频、宽带、窄带、智能和人工语言及人工音频);
11、格式———对各种格式的音频和视频进行编码的能力;
12、质量———对解码的音频或视频质量的评估。
MPEG-4的结构
MPEG-4结构将为特定问题提供完整的解决方案,并且具有对最新的音像编码技术进行灵活复制的能力。从过去MPEG的经验看,预计MPEG-4由4个不同的部分组成:MPEG-4句法描述语言、工具、算法和轮廓。这些部分如下图所示:
1.MPEG-4句法描述语言(MSDL)
MPEG-4句法描述语言的目的是便于工具、算法和轮廓的选择、描述和下载,以及描述如何分析和处理基本的数据流。MSDL将提供解决下述有关方面的途径:
协商解码器的配置,该结果将决定轮廓;
描述轮廓:各组成部分以及这些组成部分间的链接;
在非特定机器语言中下载丢失部分,特别是在音像应用中;
用与所选择的轮廓相一致的语法和语义来传送数据(音像和其他)。