我视频编码国家标准AVS与国际标准MPEG的比较


我视频编码国家标准AVS与国际标准MPEG的比较 数字音视频编解码技术标准工作组 黄铁军 本文从技术角度对MPEG-2的视频标准、MPEG-4 AVC/H.264和AVS视频(GB/T 200090.2) 三个视频标准进行对比,包括技术方案、主观测试、客观测试、复杂度等四个 方面。 一、技术对比 AVS 视频与 MPEG 标准都采用混合编码框架(见图 1),包括变换、量化、熵编码、 帧内预测、帧间预测、环路滤波等技术模块,这是当前主流的技术路线。AVS 的主要创新 在于提出了一批具体的优化技术,在较低的复杂度下实现了与国际标准相当的技术性能, 但并未使用国际标准背后的大量复杂的专利。AVS-视频当中具有特征性的核心技术包括: 8x8 整数变换、量化、帧内预测、1/4 精度像素插值、特殊的帧间预测运动补偿、二维熵编 码、去块效应环内滤波等。 熵编码 反量化 反变换 控制数据 量化后的 变换系数 运动 数据 帧内/帧间 编码控制 解码器 运动估计 变换/量化 - 环滤波 帧内 预测 运动补偿 预测 图 1 典型视频编码框架 AVS 视频编码器框图如下图所示。 图 2 AVS 视频编码器框图 AVS视频标准定义了I帧、P帧和B帧三种不同类型的图像,I帧中的宏块只进行帧内预 测,P帧和B帧的宏块则需要进行帧内预测或帧间预测,图中S0是预测模式选择开关。预测 残差进行 8×8 整数变换(ICT)和量化,然后对量化系数进行zig-zag扫描(隔行编码块使 用另一种扫描方式),得到一维排列的量化系数,最后对量化系数进行熵编码。AVS视频标 准的变换和量化只需要加减法和移位操作,用 16 位精度即可完成。 AVS 视频标准使用环路滤波器对重建图像滤波,一方面可以消除方块效应,改善重建 图像的主观质量;另一方面能够提高编码效率。滤波强度可以自适应调整。 AVS 标准支持多种视频业务,考虑到不同业务之间的互操作性,AVS 标准定义了档次 (profile)和级别(level)。档次是 AVS 定义的语法、语义及算法的子集;级别是在某一 档次下对语法元素和语法元素参数值的限定集合。为了满足高清晰度/标准清晰度数字电视 广播、数字存储媒体等业务的需要,AVS 视频标准定义了基准档次(Jizhun profile)和 4 个级别(4.0、4.2、6.0 和 6.2),支持的最大图像分辨率从 720×576 到 1920×1080,最大比 特率从 10 Mbit/s 到 30 Mbit/s。 表 1 AVS 与 MPEG-2、MPEG-4 AVC/H.264 使用的技术对比和性能差异估计 视频编码 标准 MPEG-2 视频 MPEG-4 AVC/H.264 视 频 AVS 视频 AVS 视频与 AVC/H.264 性能 差异估计 (采用信噪比 dB 估 算,括号内的百分比 为码率差异) 帧内预测 只在频域内进行 DC 系数差分预测 基于 4×4 块,9 种亮度 预测模式,4 种色度预 测模式 基于 8×8 块,5 种亮 度预测模式,4 种色度 预测模式 基本相当 多参考帧 预测 只有 1 帧 最多 16 帧 最多 2 帧 都采用两帧时相 当,帧数增加性能 提高不明显 变块大小 运动补偿 16×16 16×8(场编码) 16×16、16×8、8×16、 8×8、8×4、4×8、4×4 16×16、16×8、8×16、 8×8 降低约 0.1dB (2-4%) B 帧宏块 直接编码 模式 无 独立的空域或时域预测 模式,若后向参考帧中 用于导出运动矢量的块 为帧内编码时只是视其 运动矢量为 0,依然用 于预测 时域空域相结合,当 时域内后向参考帧中 用于导出运动矢量的 块为帧内编码时,使 用空域相邻块的运动 矢量进行预测 提高 0.2-0.3dB (5%) B 帧宏块 双向预测 模式 编码前后两个运动 矢量 编码前后两个运动矢量 称为对称预测模式, 只编码一个前向运动 矢量,后向运动矢量 由前向导出 基本相当 ¼ 像素运 动补偿 仅在半像素位置进 行双线性插值 ½像素位置采用 6 拍滤 波,¼ 像素位置线性插 值 ½像素位置采用 4 拍 滤波,¼像素位置采用 4 拍滤波、线性插值 基本相当 变换与量 化 8×8 浮点 DCT 变 换,除法量化 4×4 整数变换,编解码 端都需要归一化,量化 与变换归一化相结合, 通过乘法、移位实现 8×8 整数变换,编码 端进行变换归一化, 量化与变换归一化相 结合,通过乘法、移 位实现 提高约0.1dB(2%) 熵编码 单一 VLC 表,适应 性差 CAVLC:与周围块相关 性高,实现较复杂 CABAC:计算较复杂 上下文自适应 2D-VLC,编码块系数 过程中进行多码表切 换 降低约 0.5dB(10-15%) 环路滤波 无 基于 4×4 块边缘进行, 滤波强度分类繁多,计 算复杂 基于 8×8 块边缘进 行,简单的滤波强度 分类,滤波较少的像 素,计算复杂度低 —— 容错编码 简单的条带划分 数据分割、复杂的 FMO/ASO 等宏块、条 带组织机制、强制 Intra 块刷新编码、约束性帧 内预测等 简单的条带划分机制 足以满足广播应用中 的错误隐藏、恢复需 求 —— DCT(Discrete Cosine Transform):离散余弦变换 VLC(Variable Length Coding):变长编码 CAVLC(Context-based Adaptive Variable Length Coding):基于上下文的自适应变长码 CABAC(Context-based Adaptive Binary Arithmetic Coding):基于上下文的自适应二进制算术编码 FMO(Flexible Macroblock Ordering):灵活的宏块排序 ASO(Arbitrary Slice Ordering):任意条带排列 二、主观评价和客观测试 压缩效果的评价标准有主观评价和客观评价两种,各有优缺点。主观评判是聘请专门 的评价人员来比较压缩之后再恢复的视听效果和原始效果的差异,通常是在专门的视听环 境中按照一定的规则进行主观评分。客观评判则是通过一种具体的算法来统计多媒体数据 压缩结果的损失,例如信噪比 SNR(即信号与噪声之比的对数)。主观评判和客观评判有 时相差很大,因此衡量一个算法的好坏就需要在这二者之间找到一个平衡点。对一套标准 的评价,通常开发过程中采用客观评价的方法,但最终要得到主观评价的确认。 1.MPEG-4 AVC 视频标准主观测试 2002 年 10-12 月,MPEG 组织了专题组对 AVC (ISO/IEC 14496-10 | ITU-T Rec. H.264) 与 MPEG-4 Visual (ISO/IEC 14496-2)和 MPEG-2 Video (ISO/IEC 13818-2)标准进行了测试。 测试在 FUB/ISCTI (意大利)、NIST (美国)和 TUM (德国)进行,测试结果表明 AV C 的编码 性能有显著提高。 本次测试标准清晰度(SD)和高清晰度(HD)采用的测试条件(视频序列和码率) 如下表: 表 2 AVC 标清测试条件 Test SD Main Test Codecs AVC Main @ L3 compared against MPEG-2 MP@ML (MPEG-2 TM5 & HiQ) Resolution SD Sequences Mobile & Calendar, Husky Tempete, Football Input rate 50 fields per seconds 60 fields per seconds Bitrate 6 Mbps, 4 Mbps, 3 Mbps, 2.25 Mbps, 1.5 Mbps (AVC only) Maximum allowed intra refresh period 0.5 seconds 表 3 AVC 高清测试条件 Test HD Main Test Codecs AVC Main @ L4compared against MPEG-2 MP@HL (MPEG-2 TM5 & HiQ) Resolution 720(60p) 1080(30i) 1080(25p) Sequences Harbour, Crew Stockholm Pan, New Mobile & Calendar Vintage Car, Riverbed Input rate 60 frames per second 60 fields per second 25 frames per second Bitrate 20Mbps, 10Mbps, 6Mbps 20Mbps, 10Mbps 20Mbps, 10Mbps, 6Mbps Maximum allowed intra refresh period 0.5 seconds 图像质量主观评价试验依据 ITU-R BT.500-11 《Methodology for the subjective assessment of the quality of television pictures(电视图像质量主观评价方法)》(下面可以看 到 AV S 的两次主观测试同样采用的是这个测试标准)。测试结果如下表: 表 4 标清情况下,AVC 与优化的 MPEG(MPEG-2 HiQ)对比情况 SD Main (AVC Main vs. MPEG-2 HiQ) 序列 Football Mobile Husky Tempete 6 Mbps T T 4Mbps 1.5x T 1.5x T 3Mbps 1.3x 2x 1x /1.3x T 2.25Mbps > 1.3x 2.7x 1.3x T AVC 码率 1.5Mbps > 1.5x 4x > 1.5x T, 2x (注:表中T表示透明,压缩后与原始图像看不出差异,Nx表示被对比者码率是AVC的N倍时才能达到 同等质量,下同) 由表可以看出,12 个可比项中有 8 个的 N 大于等于 1.5,有 3 个大于等于 2,有一个 等于 4。 表 5 标清情况下,AVC 与 MPEG-2 参考软件(MPEG-2 TM5)对比情况 SD Main (AVC Main compared to MPEG-2 TM5) 序列 Football Mobile Husky Tempete 6 Mbps T T 4Mbps 1.5x T > 1.5 T 3Mbps 1.3x > 2x 2x T 2.25Mbps 1.8x > 2.7x 1.8x T AVC 码率 1.5Mbps 2x > 4x 2.7x / 2x T, 4x 由表可以看出,AV C 与 MPEG-2 参考软件比,12 个可比项中有 9 个的 N 大于等于 1.8, 有 2 个大于等于 4。 表 6 高清情况下,AVC 与优化的 MPEG(MPEG-2 HiQ)对比情况 HD Main (AVC Main compared MPEG-2 HiQ) 720 (60p) 1080 (30i) 1080 (25p) Sequence Crew Harbour Stockholm Pan New Mobile & Calendar River Bed Vintage Car 20Mbps T T T T T 10Mbps 2x T 1x T, 2x > 1x T, 2x AVC bitrates 6Mbps 1.7x T, 3.3x This bitrate was not part of the test > 1.7x 1.7x 由表可以看出,AV C 与优化的 MPEG-2 高清编码器比,9 个可比项中有 7 个的 N 大于 等于 1.7,有 3 个大于等于 2,有一个等于 3.3。 表 7 高清情况下,AVC 与 MPEG-2 参考软件(MPEG-2 TM5)对比情况 HD Main (AVC Main compared MPEG-2 TM5) 720 (60p) 1080 (30i) 1080 (25p) Sequence Crew Harbour Stockholm Pan New Mobile & Calendar River Bed Vintage Car 20Mbps T T T T T 10Mbps 2x T 2x T, 2x > 1x T, 2x AVC bitrates 6Mbps 1.7x T, 1.7x This bitrate was not part of the test > 1.7x 1.7x 由表可以看出,AV C 与 MPEG-2 参考软件比,9 个可比项中有 8 个的 N 大于等于 1.7, 有 4 个大于等于 2。 总体上讲,AV C 与 MPEG-2 对比,85 个比对中 66 对 MPEG-2 的码率要达到 1.5 倍才 能与 AV C 达到同样质量,其中 51 对 MPEG-2 码率要达到 AV C 的 2 倍才能达到 AV C 的质 量。换句话说,在 60%的情况下,AV C 的编码效率能够达到 MPEG-2 的两倍。 鉴于 AV C 的编码效率能够达到 MPEG-2 的 2 倍,我国有关测试机构在测试 AVS 时, 通常把 AV S 视频的码率也设在 MPEG-2 典型码率的二分之一或更低,也就是测试 AV S 编 码效率是 MPEG-2 的 2 倍或更高的情况下的 AV S 视频的编码质量是否能够广播要求。 2.AV S 主观测试—— 国家广播电视产品质量监督检验中心数字电视用户端产品测试 实验室 2004 年 11 月 15 日至 12 月 26 日,依据数字音视频编解码技术标准工作组的委托,国 家广播电视产品质量监督检验中心数字电视用户端产品测试实验室对工作组送检的 AV S 视频编/解码方案组织了图像质量主观评价试验。通过对委托方提供的 AV S 软编/解码器的 主观评价试验,评价 AVS 视频压缩方案的性能。 图像质量主观评价试验依据 ITU-R BT.500-11 《Methodology for the subjective assessment of the quality of television pictures(电视图像质量主观评价方法)》和 ITU-R BT.710-2《Subjective assessment of image quality in high-definition television(高清晰度电视 图像质量的主观评价)》,采用双刺激连续质量标度(DSCQS)法评价 AV S 视频编/解码系 统处理后的图像质量相对于未经压缩的原始图像质量的差别。 本次视频图像质量主观评价的目的是通过比较经 AV S 编/解码系统处理过的图像质量 与原始素材图像质量的差别来评价 AV S 视频编/解码方案的总体性能,评价素材的选择内 容应广泛且严酷度适当。所选择的测试序列应能反应图像的亮度再现、彩色再现、静态空 间分辨率、动态空间分辨率、运动再现、视在深度效果、临场感、闪烁性能和熟悉的色调 的再现等特性。希望通过所选择的节目能够充分、准确地反映被评价的视频编/解码方案的 性能。测试序列包括 8 个高清晰度节目和 8 个标准清晰度节目,每段节目时间长度为 10s~ 20s。 高清晰度图像测试序列的被评价对象与原始素材的平均得分差在1.6和6.0之间,总平 均分差为3.6,说明评价人员认为被评价对象的图像质量与原始素材的图像质量差别很小。 统计结果表明, AVS视频编/解码方案在图像格式为1920×1080P/25Hz、压缩码率为 6Mbps时,被评价对象的图像质量与原始素材图像质量的差别很小,不易察觉。 8个标准清晰度图像测试序列的被评价对象与原始素材的平均得分差在1.1 和10.5之 间,总平均分差为6.4。除序列2 外,其他7 个测试序列的标准偏差均在6.4 至8.6 之间, 说明评价人员对这些测试序列打分的离散度较小。 试验结果表明AVS 视频编/解码方案在图像格式为720×576I/50Hz、压缩码率为 2.5Mbps 时,可察觉经编/解码处理后的被评价对象与原始素材图像质量的差别,但差别小。 本次测试表明,AVS视频码率不到MPEG-2典型码率二分之一(标清)和三分之一(高 清)的情况下,质量损失很小,可以达到广播要求。 3.AV S主观测试——国家广电总局广播电视规划院 2005年04月至9月,国家广电总局广播电视规划院受AVS工作组挂靠单位中国科学院 计算技术研究所委托,对经过AVS参考软件编解码后的标准清晰度和高清晰度视频进行主 观评价,评价其对源图像的质量损伤程度,完成了《AVS视频压缩质量主观评价》测试报 告(附件)。 本次测试的依据是广电行业标准GY/T 134-1998《数字电视图像质量主观评价方法》和 ITU-R BT.500-11、ITU-R BT.1210-3《Test Materials to be used in Subjective Assessment(用 于主观评价的测试材料)》标准。标清测试采用6个国际标准图像序列,高清采用6个国家 标准图像序列。 测试结果汇总如下: 表 8 AVS 主观测试结果 测试码率 \ 视频类型 标准清晰度(625/50i) 高清晰度(1125/50i) AV S 测试码率(Mbps) 3 1.5 10 6 测试结果 优秀 良好 优秀 良好到优秀 考虑到目前使用MPEG-2标准实施高清电视广播时,一般使用20Mbps的码率,使用 MPEG-2标准实施标清电视广播时,一般使用5-6Mbps的码率,对照本次测试结果可以得知, AVS码率为现行MPEG-2标准的一半时,无论是标准清晰度还是高清晰度,编码质量都达 到优秀。码率不到其三分之一时,也达到良好到优秀。因此相比于MPEG-2视频编码效率 高2~3倍的前提下,AVS视频质量已完全达到了大范围应用所需的“良好”要求。对比MPEG 标准组织对MPEG-4 AVC/H.264的测试报告,AVS在编码效率上与其处于同等技术水平。 4.AV S与MPEG标准的客观测试 对视频编码标准进行客观评价的常用方法是峰值信噪比PSNR。表9、表10分别给出了 AVS与MPEG-2标准以及AVS与MPEG-4 AVC/H.264标准main profile的客观编码性能。结果 为相同码率条件下峰值信噪比PSNR的增益。可以看出,AVS相对于MPEG-2标准编码效率 平均提高2.56dB,相比于H.264标准编码效率略低,平均有0.11dB的损失。 表 9 AVS 与 MPEG-2 标准客观编码效率比较 HD progressive 序列 SD interlace 序列 AV S 相比于 MPEG-2 pedestrain Station2 Rushhour hourseriding Zy PSNR 增益(dB) 2.53 1.75 1.39 4.59 2.55 表 10 AVS 与 MPEG-4 AVC/H.264 标准 main profile 客观编码效率比较 HD progressive 序列 SD interlace 序列 AV S 相比于 H.264 pedestrain Station2 Rushhour hourseriding Zy PSNR 增益(dB) -0.07 0.17 -0.18 -0.28 -0.17 下面是另一组视频序列的 AV S 和 H.264 的性能比较实验结果。实验使用的 AV S 视频 编码器是 RM 5.0a,H.264 编码器是 JM 6.1e。实验序列包括 720p 和 1080i 序列。编码参数 见表 4。表 11-12 给出了 AV S 视频标准相对 H.264 在 PSNR 上的增益。图 5 到图 8 给出了 PSNR 曲线。 表 11 AVS 和 H.264 编码参数 JM 6.1e RM 5.0a 熵编码 CABAC 2D-VLC 率失真优化 使用 使用 参考图像 2帧 2帧 B 帧 2帧(IBBP) 2帧(IBBP) 隔行编码 宏块帧/场自适应 图像帧/场自适应 运动补偿块大小 16×16 到 4×4 16×16 到 8×8 环路滤波 使用 使用 表 12 AVS 和 H.264 实验结果 逐行扫描(1280×720) 隔行扫描(1920×1080) 序列 PSNR 增益 序列 PSNR 增益 City -0.2239 dB Fireworks -1.2670 dB Crew 0.0238 dB Flamingo -0.0638 dB Harbour 0.2881 dB Kayaka -0.3138 dB Night 0.0435 dB Spincalendar -0.3681 dB 平均 -0.0473 dB 平均 -0.5482 dB City 32 33 34 35 36 37 38 39 40 41 0 2000 4000 6000 8000 10000 12000 bitrate (kbit/s) PS NR (dB) AVS H.264 图 3 City 序列实验结果 Harbour 32 33 34 35 36 37 38 39 40 41 0 5000 10000 15000 20000 bitrate (kbit/s) PSNR (dB) AVS H.264 图 4 Harbour 序列实验结果 Spincalendar 32 33 34 35 36 37 38 39 40 0 5000 10000 15000 20000 bitrate (kbit/s) PSNR (dB) AVS H.264 图 5 Spincalendar 序列实验结果 Flamingo 32 33 34 35 36 37 38 39 40 41 10000 20000 30000 40000 50000 60000 bitrate (kbit/s) PSNR (dB) AVS H.264 图 6 Flamingo 序列实验结果 从上面的数据可以看出,在逐行编码方面,AVS 视频标准的性能与 H.264 基本一致; 在隔行编码方面,由于 AVS 视频标准目前只支持图像级帧/场自适应编码,平均有 0.5dB 的性能差距。 三、复杂度对比 表 13 对 AVS 与 H.264 的计算实现复杂性进行扼要对比,大致估算,AVS 解码复杂度 相当于 H.264 的 30%,AVS 编码复杂度相当于 H.264 的 70%。 表 13 AVS 与 H.264 计算复杂性对比 技术模块 AVS 视频 MPEG-4 AVC/H.264 视频 复杂性分析 帧内预测 基于 8×8 块,5 种亮度预测 模式,4 种色度预测模式 基于 4×4 块,9 种亮度预测 模式,4 种色度预测模式 降低约 50% 多参考帧预测 最多 2 帧 最多 16 帧,复杂的缓冲区管 存储节省 50%以上 理机制 变块大小运动补 偿 16×16、16×8、8×16、8×8 块 运动搜索 16×16、16×8、8×16、8×8、 8×4、4×8、4×4 块运动搜索 节省 30~40% B 帧宏块对称模 式 只搜索前向运动适量即可 双向搜索 最大降低 50% ¼像素运动补偿 ½像素位置采用 4 拍滤波 ¼像素位置采用 4 拍滤波、 线性插值 ½像素位置采用 6 拍滤波 ¼ 像素位置线性插值 降低 1/3 存储器的 访问量 变换与量化 解码端归一化在编码端完 成,降低解码复杂性 编解码端都需进行归一化 解码器低于 熵编码 上下文自适应 2D-VLC , Exp-Golomb 码降低计算及 存储复杂性 CAVLC:与周围块相关性 高,实现较复杂 CABAC:硬件实现特别复杂 相比 CABAC 降低 30%以上 环路滤波 基于 8×8 块边缘进行,简单 的滤波强度分类,滤波较少 的像素 基于 4×4 块边缘进行,滤波 强度分类繁多,滤波边缘多 降低 50% Interlace 编码 PAFF 帧级帧场自适应 MBAFF 宏块级帧场自适应 降低 30% 容错编码 简单的条带划分机制足以满 足广播应用中的错误隐藏、 恢复需求 数据分割、复杂的 FMO/ASO 等宏块、条带组织机制、强 制 Intra 块刷新编码、约束性 帧内预测等 实现特别复杂 大大低于 四、小结 AV S 视频标准(GB/T 20090.2)是基于我国自主创新技术和国际公开技术所构建的标 准,主要面向高清晰度和高质量数字电视广播、网络电视、数字存储媒体和其他相关应用, 具有以下特点:(1)性能高,编码效率是 MPEG-2 的 2 倍以上,与 H.264 的编码效率处于 同一水平;(2)复杂度低,算法复杂度比 H.264 明显低,软硬件实现成本都低于 H.264;(3) 我国掌握主要知识产权,专利授权模式简单,费用低。基于此,我们认为 AV S 标准是能够 支撑国家数字音视频产业发展的重要标准。 参考文献 [1] 信息技术 先进音视频编码 第 2 部分:视频. AVS N1165, 2005 [2] 黄铁军,高文. AVS 标准制定背景与知识产权状况. 电视技术. 2005 年第 7 期.P4-7 [3] Liang Fan, Siwei Ma, Feng Wu. Overview of AVS Video Standard. Proc. 2004 IEEE Intl. Conf. Multimedia & Expo., 2004: 423-426 [4] 梁凡. AVS 视频标准的技术特点. 电视技术. 2005 年第 7 期 [5] ISO/IEC JTC1/SC29/WG11 (MPEG). N6231 Report of The Formal Verification Tests on AVC (ISO/IEC 14496-10 | ITU-T Rec. H.264). December 2003, Waikoloa [6] 国家广播电视产品质量监督检验中心. AVS视频编/解码方案图像质量主观评价试验报告. 2004年12 月 [7] 国家广播电影电视总局广播电视规划院. AVS 视频压缩质量主观评价(AVS 参考软件 5.2 版)测试 报告. 2005 年 9 月
还剩11页未读

继续阅读

下载pdf到电脑,查找使用更方便

pdf的实际排版效果,会与网站的显示效果略有不同!!

需要 15 金币 [ 分享pdf获得金币 ] 0 人已下载

下载pdf

pdf贡献者

sawah

贡献于2011-10-31

下载需要 15 金币 [金币充值 ]
亲,您也可以通过 分享原创pdf 来获得金币奖励!
下载pdf