• opencv6.2-imgproc图像处理模块之图像尺寸上的操作及阈值


    接opencv6.1-imgproc图像处理模块之平滑和形态学操作,顺带说一句在opencv中的in-place操作就是比如函数的输入图像和输出图像两个指针是相同的,那么就是in-place操作了。比如很多函数支持目标图像和原图像是同一个内存区域。

    三、图像的失真缩放

    采用 pyrUp 和 pyrDown 对图像进行向上和向下采样来达到图像放大和缩小的目的。在这其中的操作是失真操作,所以放大的时候会模糊很多。在这里顺带补上opencv中真正的缩放函数resize()。

    这两个函数又叫做上采样和下采样,其实在http://blog.csdn.net/shouhuxianjian/article/details/40888715 中这个CNN的训练过程中就有这两个概念,这就像是金字塔一样:


    如上图所示,顶层为原始大小的图像,那么往下就叫做下采样,会使得图像越来越小;反之如果底层为原始大小图像,那么往上就叫做上采样,会使得图像越来越大。一般来说,有两种类型的图像金字塔常常出现在文献和应用中:

    a、高斯金字塔(Gaussian pyramid): 用来向下采样

    b、拉普拉斯金字塔(Laplacian pyramid): 用来从金字塔低层图像重建上层未采样图像。

    在这篇文档中我们将使用 高斯金字塔 :

    G_(i)和G_(i+1)表示从上往下相邻的两幅图。我们得到了G_(i)的图,如何采用高斯金字塔得到下层更小的图呢?

    1、将 G_(i)与高斯内核卷积:

    2、将偶数行和列删除。

    pyrDown( src, dst, Size( src.cols/2, src.rows/2 ) );//采用的就是上面的原理
    函数原型为:void pyrDown(InputArray src, OutputArray dst, const Size& dstsize=Size(), int borderType=BORDER_DEFAULT);

    前两个参数就不介绍了;第三个参数表示的是输出图像的大小,默认的就是Size((src.cols+1)/2, (src.rows+1)/2)。不过在任何情况下,都受约束:

    |dstsize.width * 2 - src.cols| ≤ 2
    |dstsize.height * 2 - src.rows| ≤ 2

    那么这样就得到原始图像的1/4大小;如何进行上采样恢复呢?

    1、将图像在每个方向扩大为原来的两倍,新增的行和列以0填充;

    2、使用先前同样的内核(乘以4)与放大后的图像卷积,获得 “新增像素” 的近似值。

    pyrUp( src, dst, Size( src.cols*2, src.rows*2 ) );
    函数原型为:void pyrUp(InputArray src, OutputArray dst, const Size& dstsize=Size(), int borderType=BORDER_DEFAULT );

    第三个参数默认情况下是:Size(src.cols*2, (src.rows*2),不过在任何情况下,都受约束:

    |dstsize.width - src.cols * 2| ≤ (dstsize.width mod 2)
    |dstsize.height - src.rows * 2| ≤ (dstsize.height mod 2)

    这个函数执行的是高斯金字塔重构的上采样,尽管实际上它能够用来重构拉普拉斯金字塔。

    四、阈值操作

    OpenCV中提供了阈值(threshold)函数: threshold().阈值的原理就是设定一个值,将大于这个值的像素做一个操作;小于这个值的像素做另一个操作。比如可以设定二值阈值化,大于100的像素点直接设置成255,小于100的像素点直接设置成0,达到巨大反差的效果。

    在opencv中有5种阈值的操作:二进制阈值、反二进制阈值、截断阈值、阈值化为0、反阈值化为0.

    1、二进制阈值


    解释:在运用该阈值类型的时候,先要选定一个特定的阈值量,比如:125,这样,新的阈值产生规则可以解释为大于125的像素点的灰度值设定为最大值(如8位灰度值最大为255),灰度值小于125的像素点的灰度值设定为0。

    2、反二进制阈值


    解释:该阈值化与二进制阈值化相似,先选定一个特定的灰度值作为阈值,不过最后的设定值相反。(在8位灰度图中,例如大于阈值的设定为0,而小于该阈值的设定为255)。

    3、截断阈值


    解释:同样首先需要选定一个阈值,图像中大于该阈值的像素点被设定为该阈值,小于该阈值的保持不变。(例如:阈值选取为125,那小于125的阈值不改变,大于125的灰度值(230)的像素点就设定为该阈值)。

    4、阈值化为0


    解释::先选定一个阈值,然后对图像做如下处理:1 像素点的灰度值大于该阈值的不进行任何改变;2 像素点的灰度值小于该阈值的,其灰度值全部变为0。这个很像Hinton他们提出的ReLU啊。操作过程是完全的一模一样啊。

    5、反阈值化为0


    解释:原理类似于0阈值,但是在对图像做处理的时候相反,即:像素点的灰度值小于该阈值的不进行任何改变,而大于该阈值的部分,其灰度值全部变为0

    这5个阈值操作也是在一个函数上运行得到的,函数的原型为:

    double threshold(InputArray src, OutputArray dst, double thresh, double maxval, int type);

    参数列表:原图像、目的图像、阈值、最大值、阈值类型。

    原图像:单通道的,而且是8位或者32位的浮点数

    目标图像:与原图像一样

    阈值:自己定

    最大值:需要与THRESH_BINARY和THRESH_BINARY_INV这两种阈值类型情况下才会起作用

    阈值类型:THRESH_BINARY、THRESH_BINARY_INV、THRESH_TRUNC、THRESH_TOZERO、THRESH_TOZERO_INV,这5个内部定义的enum类型,它们的值分别为(0,1,2,3,4);

    note:正如上面的函数原型第一个参数说的,这个函数只支持灰度图,所以使用之前需要使用cvtColor()函数进行转换。

    五、边界扩充

    这个部分在本科做图像处理的时候不知道有这个函数,自己硬生生的造了次轮子。原理就是当我们采用自己编写的过滤器或者卷积等操作的时候,图像内部的位置自然不用我们操心,可是当针对边界部分的像素,你说丢弃吧,又有些可惜,不丢弃吧,又没法操作。在opencv中是通过先将原始图像复制到另一个更大的图矩阵中,然后采用不同的方法来扩充边界(为什么需要复制呢,因为原始图像所占内存已经固定,不好自动扩展,当然了ROI也是取图像内部,所以可以直接在原始图像矩阵的内存上操作)。

    函数原型为:void copyMakeBorder(InputArray src, OutputArray dst, int top, int bottom, int left, int right, int borderType,const Scalar& value=Scalar() );

    参数列表:原始图像、目标图像、顶部扩充大小、底部扩充大小、左边扩充大小、右边扩充大小、边界类型、边界值;

    原始图像:没有任何约束;

    目标图像:与原始图像有着同样的类型,但是尺寸变成了:Size(src.cols+left+right, src.rows+top+bottom)。

    接下来四个参数:指定往外扩充的大小,top=1, bottom=1, left=1, right=1,那么就是表示往外扩充1个像素。

    边界类型:从<imgproc.hpp>中62行开始的

      enum{ BORDER_REPLICATE=IPL_BORDER_REPLICATE, BORDER_CONSTANT=IPL_BORDER_CONSTANT,
           BORDER_REFLECT=IPL_BORDER_REFLECT, BORDER_WRAP=IPL_BORDER_WRAP,
           BORDER_REFLECT_101=IPL_BORDER_REFLECT_101, BORDER_REFLECT101=BORDER_REFLECT_101,
           BORDER_TRANSPARENT=IPL_BORDER_TRANSPARENT,
           BORDER_DEFAULT=BORDER_REFLECT_101, BORDER_ISOLATED=16 };

              表明这也是个enum类型,其中有着不同边界类型的内置情况。值分别为(1,0,2,3,4,4,5,4,16);不过在  

         《opencv2.4.9refman》中对这个函数就介绍了两种情况:常数边界( BORDER_CONSTANT)和复制边界(BORDER_REPLICATE);

    边界值:当第四个参数边界类型为常数边界的时候,这个值才有效。

    note:该函数是将原图像复制到目标图像的中间,然后进行边界的扩充,但是对于FilterEngine或者过滤函数来说,却不是基于这个函数来的,不过对于其他更加复杂的函数,包括自己写的函数,却可以这样简单的处理图像边界;

    这个函数也支持当原图像已经被复制到了目标图像中间,这样的话这个函数就不复制原图像自身了,而是只简单的扩充边界(这种情况多见于采取ROI,也就是你已经在原始图像上选定了一个ROI,只是需要用其他颜色把这个ROI框起来罢了。)

    不过有时候我们不想这样做,所以需要关闭那个自动优化的功能,然后总是做额外的填充,那么如果原图像不是一个ROI的话,可以将边界设置成BORDER_ISOLARED.


  • 相关阅读:
    [团队项目]典型用户
    0415 操作系统_实验二、作业调度模拟程序
    0415 结对2.0评价
    复利计算- 结对2.0--复利计算WEB升级版
    0408汉堡
    复利计算- 结对1.0
    0405《构建之法》第四章读后感
    复利计算器4.0 【java版】
    复利计算器的单元测试结果
    操作系统 实验一、命令解释程序的编写实验
  • 原文地址:https://www.cnblogs.com/shouhuxianjian/p/4529179.html
Copyright © 2020-2023  润新知