一、视频信号的高宽带性
一般而言,视频信号信息量较大,传输网络需要的带宽相对较宽。这是为了获得视频信息的直观性、高效性及确定性所付出的代价。
二、视频压缩编码的目标
(1)必须压缩在一定的带宽内,即视频编码器具有足够压缩比的功能;
(2)视频信号压缩之后,经恢复应保持一定的视频质量。两个标准:主观质量和客观质量(信噪比来表示)。
三、视频压缩常用的编码形式
(1)预测编码
利用同一帧相邻像素(帧内预测编码)及相邻两帧图形之间(帧间预测编码)的相关性进行预测编码;通俗地讲,同一图像中的两个相邻的像素突变的概率极小,“相等、相似或缓变”的概率极大,利用这种相关性,我们可以选定一定的参考像素点将其一定距离内的像素值与之相减得到可以用更小位数表示的差值(例如原来每个像素点的值用8位数据表示,但由于相邻像素点之间的差值很小,这些差值也许可用四位就可以表示,于是传输时就只要将参考的8位像素点及其4位的差值进行传输,结果就减少了传输的数据量)。当然相邻两帧图像之间的相关性更强,可得到更大的压缩比。
(2)变换编码
通过类似于时域到频域变换简化积分计算的方法,我们也可以通过将图像进行某种数学变换得到变换域中的图像,完成压缩编码。
四、视频压缩编码技术综述
(1)信源模型
对于一个视频我们可以从不同的角度对其进行建模,一般称为信源模型。如果我们将一帧图像看作是有一个个像素组成的,则该模型的参数就是每个像素的亮度和色度的幅度值,对其进行编码时我们叫做基于波形的编码。另一方面,如果我们将模型中的一个分量看做是由几个物体构成,则这个模型的参数就是各个物体的形状和运动,对其进行编码时我们叫做基于内容的编码。
(2)基于波形的编码
基于波形的编码采用的是将预测编码和变换编码组合起来形成基于块的混合编码,一般块的大小有8x8,16x16等。
(3)基于内容的编码
对于一个视频中的一帧图像,如果包含对个运动对象,这时我们仍然采用强制性的手段将图像分成小块,这时可能存在同一块中有两个不同物体的边界,此时我们就不能用同一个运动矢量来表达这两个不同物体的运动状态,于是我们提出了基于内容的编码。首先,将图像按其中包含的不同对象分成块,然后按照不同对象的形状、运动和纹理进行编码。在最简单的情况下,我们可以利用物体的二维轮廓描述物体的形状,利用运动矢量描述物体的运动态,利用颜色波形描述物体的纹理等特征。
(4)三维(立体)视频编码
随着技术的发展及人们对视频要求的提高,三维视频编码是一个发展的趋势。
立体视频编码也有两种类型:一是基于波形的编码,它是将运动补偿预测和位差补偿预测进行了组合。其中位差估计指的是在两幅不同的图像中寻找对应的点,对预测残差图像、位差和运动矢量进行编码。另一种是基于物体的,它直接对物体的三维结构和运动进行编码。