视频压缩编码
随着互联网带宽的不断增加,互联网上传输视频的相关技术已成为互联网部分研发的热点。
目前,许多实验性高速宽带网络都将视频传输技术和应用作为研究热点。
通过因特网传输视频存在许多困难。
根本原因是因特网的无连接转发机制主要是为突发数据传输而设计的,不适合连续媒体流的传输。
为了在因特网上有效和高质量地传输视频流,需要各种技术,数字视频压缩编码技术是互联网视频传输的关键技术之一。
与H.261和H.263类似,H.264也是使用DCT变换编码加DPCM的差分编码,即混合编码结构。
同时,H.264在混合编码的框架下引入了一种新的编码方法,提高了编码效率,更接近实际应用。
H.264没有繁琐的选择,但是努力实现简单的“回归基础”。
它具有比H.263 ++更好的压缩性能,并且能够适应多个通道。
H.264具有广泛的应用,可以满足不同速度和场合的视频应用。
它具有更好的抗错误和防丢包能力。
H.264的基本系统不需要使用版权,具有开放性,并且可以很好地适应IP和无线网络的使用。
这对于当前在因特网上传输多媒体信息和在移动网络中传输宽带信息具有重要意义。
尽管H.264编码的基本结构类似于H.261和H.263,但它在许多方面已得到改进,并在下面列出。
1.各种更好的运动估计高精度估计在H.263中使用半像素估计,并且在H.264中进一步使用1/4像素或甚至1/8像素的运动估计。
也就是说,实际运动矢量的位移可以基于1/4或甚至1/8像素。
显然,运动矢量位移的精度越高,帧之间的残差越小,传输码率越低,即压缩比越高。
在H.264中使用6阶FIR滤波器的内插来获得1/2像素位置的值。
当获得1/2像素值时,可以通过线性插值获得1/4像素值。
对于4:1:1视频格式,亮度信号的1/4像素精度对应于色度部分的1/8像素。
因此,运动矢量需要对色度信号进行1/8像素内插操作。
理论上,如果运动补偿的精度加倍(例如,从整数像素精度到1/2像素精度),则可能存在0.5位/样本的编码增益,但实际验证发现运动矢量精度超过1/8像素。
之后,系统基本没有明显的收益。
因此,在H.264中,仅使用具有1/4像素精度的运动矢量模式而不是1/8像素精度。
多宏块分区模式估计在H.264的预测模式中,宏块(MB)可以被划分为7种不同的模式大小。
这种多模式灵活和微妙的宏块分区更适合实际图像。
然后,移动物体的形状可以包括每个宏块中的1,2,4,8或16个运动矢量。
多参数帧估计在H.264中,可以使用多个参数帧的运动估计,即,存在仅在编码器的缓冲器中编码的多个参数帧,并且编码器选择从中给出更好编码的参数帧。
该效果被作为参数帧,并且指出哪个帧用于预测,使得比刚刚编码的前一帧更好的编码效果被用作预测帧。
帧内压缩也称为空间压缩。
当压缩一帧图像时,不管相邻帧之间的冗余信息如何,仅考虑当前帧的数据,这实际上类似于静态图像压缩。
有损压缩算法通常用在帧中。
由于帧内压缩中的帧之间没有相关性,因此仍然可以以帧为单位编辑压缩视频数据。
帧内压缩通常不能实现高压缩。
帧间压缩的使用基于以下事实:许多视频或动画在两个连续帧之间具有大的相关性,或者两个帧的信息很小。
也就是说,连续视频在相邻帧之间具有冗余信息。
根据该特征,压缩相邻帧之间的冗余量可以进一步增加压缩量并降低压缩比。
帧间压缩(也称为时间压缩)通过比较时间线上不同帧之间的数据来压缩。
帧间压缩通常是无损的。
帧差分算法是一种典型的时间压缩方法。
通过比较该帧与相邻帧之间的差异,仅记录当前帧与其相邻帧之间的差异,这可以大大减少数据量。