AVS3–中国的视频编解码技术

11月3日,中国2020年度国家技术发明奖一等奖(总共3个)被授予“超高清视频多态基元编解码关键技术”。该技术突破了传统视频编码和计算框架,形成了完全自主的编解码技术体系。

在视频编解码领域,中国的国际话语权缺失。2002年由北京大学高文院士牵头的数字音视频编解码技术标准(简称AVS,Audio Video coding Standard)工作组成立,致力于制定掌握自主知识产权的音视频编解码技术标准,而 “超高清视频多态基元编解码关键技术” 正是AVS工作组的技术成果。

AVS制定的一系列音视频编解码技术标准,包括系统、视频、音频、数字版权管理等四个主要技术标准和符合性测试支撑标准。AVS3是其第3代音视频编解码技术标准(前两代是AVS/AVS+,AVS2),适应多种位率、分辨率和质量要求的高效视频压缩方法的解码过程,在解码效率上优势明显,可广泛适用于电视广播、数字电影、网络电视、网络视频、视频监控、实时通信、即时通信、数字存储媒体、静止图像等应用。

目前主流的视频编码标准主要是3类:一个是行业研究机构,ISO/IEC MPEG的MPEG系列,ITU-T的H.26X系列, MPEG和 ITU-T 联合组成的JVET推出的H.264(AVC),H.265(HEVC),H.266(VVC)。第二个是以Google等企业牵头组成的开放媒体联盟Alliance for Open Media (AOM)推出的VP8,VP9,AV1,AV2。第三个是中国的AVS工作组推出的AVS,AVS2,AVS3。

AVS3的关键技术及应用

编码块划分技术,把复杂多样的图像划分成多个矩形块,有针对性的以块为单位的图像进行有效的编码,最后再以块为单位去解码图像。

帧内预测,利用视频空间域的相关性,使用同一帧图像内邻近已编码像素预测当前的像素,以达到有效去除视频时域冗余的目的,提升预测效率。

帧间预测,利用视频时间域的相关性,使用邻近已编码图像像素预测当前图像的像素,以达到有效去除视频时域冗余的目的。

变换,即PBT(基于位置的变换 Position Based Transform),根据帧间预测残差块的子块位置选择进行相应的DCT8或者DST7变换,每个子块根据其位置使用预先设计的变换集,用于更高效地拟合帧间残差特性。

国内AVS编码技术主要应用在广电领域,例如高清电视,IPTV,卫星电视等。新开播的 CCTV16以及8K高清频道已采用AVS编码技术,其中CCTV16是4K和高清同播的,4K采用AVS2,高清采用AVS+,而之前已开播的8K频道采用AVS3。

AVS1, AVS2标准均已被批准为国标,标准号分别是 GB/T 20090-2016 ,GB/T 33475-2016,而最新的AVS3标准因为处于发展阶段,目前还仅是团体标准(团体标准号T/AI109.2-2021),从AVS3这个团体标准的起草单位看,涵盖的行业范围还是很广的,既包括了传统的大学,研究机构,芯片设计制造厂家,也包括了新兴的互联网公司(腾讯,阿里云,字节跳动),另外安防领域的两个龙头海康和大华也参加了标准的起草,在AVS1, AVS2标准中是不曾见到的。