图像金字塔是图像中多尺度表达的一种,最主要用于图像的分割,是一种以多分辨率来解释图像的有效但概念简单的结构。
图像金字塔最初用于机器视觉和图像压缩,一幅图像的金字塔是一系列以金字塔形状排列的,分辨率逐步降低且来源于同一张原始图的图像集合。其通过梯度向下采样获得,直到达到某个终止条件才停止采样。
金字塔的底部是待处理图像的高分辨率表示,而顶部是低分辨率的近似。
我们将一层一层的图像比喻成金字塔,层级越高,则图像越小,分辨率越低。
一般情况下有两种类型的图像金字塔常常出现在现在文献及实际应用中。他们分别是:
(1)高斯金字塔(Gaussianpyamid)----用来向下采样,主要的图像金字塔。
(2)拉普拉斯金字塔(Laplacianpyamid)----用来从金字塔底层图像重建上层未采样图像,在数字图像处理中也即是预测残差,可以对图像进行最大程度的还原,配合高斯金字塔一起使用。
两者的主要区别在于:高斯金字塔用来向下降采样图像,而拉普拉斯金字塔则用来从金字塔底层图像中向上采样,重建一个图像。
要从金字塔第 i 层生成第(i+1)层(我们将第(i+1)层表示为G(i+1)),我们先要用高斯核对Gi进行卷积, 然后删除所有偶数行和偶数列,新得到图像面积会变为源图像的四分之一。按上述过程对输入图像G0执行操作就可以产生整个金字塔。
高斯金字塔
高斯金字塔是通过高斯平滑和亚采样获得一些列下采样图像, 也就是说第K层高斯金字塔通过平滑、亚采样就可以获得K+1层高斯图像。高斯金字塔包含来一些列低通滤波器,其截至频率从上一层到下一层以因子2逐渐增加,所以高斯金字塔可以跨越很大的频率范围。
另外,每一层都按从下到上的次序编号,层级G(i+1)(表示为G(i+1)尺寸小于第i层G(i)).
1.对图像的向下取样
为了获取层级为G(i+1)的金字塔图像, 我们采用如下方法:
(1)对图像G(i)进行高斯内核卷积;
(2)将所有偶数行和列去除。
得到的图像即为G(i+1)的图像, 显而易见,结果图像只有原图像的四分之一。通过对输入图像G(i)(原始图像)不停迭代以上步骤就会得到整个金字塔。同时我们也可以看到,向下取样会逐渐丢失图像的信息。
2.图像向上取样
如果想放大图像,则需要通过向上取样操作得到,具体做法如下:
(1)将图像在每个方向扩大为原来的两倍,新增的行和列以0填充。
(2)使用先前同样的内核(乘以4)与放大后的图像卷积,获得“新增像素”的近似值。
得到的图像即为放大后的图像,但是与原来的图像相比会发觉比较模糊,因为在缩放的过程中已经丢失了一些信息。如果想在缩小和放大整个过程中减少信息的丢失,这些数据就形成了拉普拉斯金字塔。
拉普拉斯金子塔是通过原图像减去先缩小后放大的图像的一系列图像构成的。
DOG金字塔(Difference of Gaussian-DOG)
通俗描述:就是把同一张图像在不同的参数下做高斯模糊之后的结果相减,得到的输出图像。称为高斯不同(DOG)。高斯不同是图像的内在特征,在灰度图像增强、角点检测中经常用到。
理论描述:差分金字塔DOG是在高斯金字塔的基础上构建起来的,其实生成高斯金字塔的目的就是为了构建DOG金字塔。DOG金字塔的第一组第一层是由高斯金字塔的第一组第二层减去第一组第一层得到的。以此类推,逐组逐层生成每一个差分图像,所有差分图像构成差分金字塔。概括为DOG金字塔的第0组和第l层图像是由高斯金字塔的第0组第i+1层减去第0组第i层得到的。