• 用Numpy,Open-CV增强灰度图像


    作者|Kavya Musty
    编译|Flin
    来源|medium

    我们经常扫描纸张把它们转换成图像。我们有各种各样的工具可以在线增强这些图像,使它们的亮度更亮,并消除这些图像中的阴影。如果我们可以手动去除阴影呢?我们可以将任何图像作为灰度图像加载到我们的代码中,并在几秒钟内获得输出,而无需任何应用程序的帮助。

    这可以通过使用基本的Numpy操作和一些open CV函数来实现。为了解释这个过程,我们使用了下面的图片,它是用手机拍的。

    很明显,有一个阴影需要删除。让我们开始吧。

    1. 将必要的软件包导入你的环境。为了易于显示图像,我们使用Jupyter Notebook。
    import cv2
    import numpy as np
    import matplotlib.pyplot as plt
    
    1. 删除阴影时,有两件事要注意。由于图像是灰度图像,如果图像背景较浅且对象较暗,则必须先执行最大值滤波,然后再执行最小值滤波。如果图像背景较暗且物体较亮,我们可以先执行最小值滤波,然后再进行最大值滤波。

    那么,最大值滤波和最小值滤波到底是什么?

    1. 最大值滤波:让我们假设我们有一个特定大小的图像 I 。我们编写的算法应逐个遍历 I 的像素,并且对于每个像素(x,y),它必须找到该像素周围的邻域(大小为N x N的窗口)中的最大灰度值,并将该最大灰度值写入A中相应的像素位置(x,y)。所得图像 A 称为输入图像 I 的最大值滤波图像。

    让我们在代码中实现这个概念。

    • max_filtering()函数接受输入图像和窗口大小N。

    • 它最初在输入数组周围创建一个“wall”(带有-1的填充),当我们遍历边缘像素时会有所帮助。

    • 然后,我们创建一个“ temp”变量,将计算出的最大值复制到该变量中。

    • 然后,我们遍历数组,并围绕当前像素大小N x N创建一个窗口。

    • 然后,我们使用“ amax()”函数在该窗口中计算最大值,并将该值写入temp数组。

    • 我们将该临时数组复制到主数组A中,并将其作为输出返回。

    • A是输入I的最大值滤波图像。

    def max_filtering(N, I_temp):
        wall = np.full((I_temp.shape[0]+(N//2)*2, I_temp.shape[1]+(N//2)*2), -1)
        wall[(N//2):wall.shape[0]-(N//2), (N//2):wall.shape[1]-(N//2)] = I_temp.copy()
        temp = np.full((I_temp.shape[0]+(N//2)*2, I_temp.shape[1]+(N//2)*2), -1)
        for y in range(0,wall.shape[0]):
            for x in range(0,wall.shape[1]):
                if wall[y,x]!=-1:
                    window = wall[y-(N//2):y+(N//2)+1,x-(N//2):x+(N//2)+1]
                    num = np.amax(window)
                    temp[y,x] = num
        A = temp[(N//2):wall.shape[0]-(N//2), (N//2):wall.shape[1]-(N//2)].copy()
        return A
    
    1. 最小值滤波:此算法与最大值滤波完全相同,但是我们不去找邻近的最大灰度值,而是找到了该像素周围N x N邻近的最小值,并将该最小灰度值写入B中的(x,y)。所得的图像 B 称为图像 I 的经过最小值滤波的图像。

    让我们对该函数进行编码。

    def min_filtering(N, A):
        wall_min = np.full((A.shape[0]+(N//2)*2, A.shape[1]+(N//2)*2), 300)
        wall_min[(N//2):wall_min.shape[0]-(N//2), (N//2):wall_min.shape[1]-(N//2)] = A.copy()
        temp_min = np.full((A.shape[0]+(N//2)*2, A.shape[1]+(N//2)*2), 300)
        for y in range(0,wall_min.shape[0]):
            for x in range(0,wall_min.shape[1]):
                if wall_min[y,x]!=300:
                    window_min = wall_min[y-(N//2):y+(N//2)+1,x-(N//2):x+(N//2)+1]
                    num_min = np.amin(window_min)
                    temp_min[y,x] = num_min
        B = temp_min[(N//2):wall_min.shape[0]-(N//2), (N//2):wall_min.shape[1]-(N//2)].copy()
        return B
    
    1. 因此,如果图像的背景较浅,我们要先执行最大值滤波,这将为我们提供增强的背景,并将该最大值滤波后的图像传递给最小值滤波函数,该函数将负责实际的内容增强。

    2. 因此,执行最小-最大值滤波后,我们获得的值不在0-255的范围内。因此,我们必须归一化使用背景减法获得的最终阵列,该方法是用原始图像减去最小最大值滤波后的图像,以获得去除了阴影的最终图像。

    #B is the filtered image and I is the original image
    def background_subtraction(I, B):
        O = I - B
        norm_img = cv2.normalize(O, None, 0,255, norm_type=cv2.NORM_MINMAX)
        return norm_img
    
    1. 变量N(用于过滤的窗口大小)将根据图像中粒子或内容的大小进行更改。对于测试图像,选择大小N = 20。增强后的最终输出图像如下所示:

    输出图像是原始图像增强后的结果。所实现的代码是在open CV中手动实现一些库函数以增强图像的拙劣尝试。带有图像的整个notebook可以在下面的Github链接中找到。

    原文链接:https://medium.com/swlh/enhancing-gray-scale-images-using-numpy-open-cv-9e6234a4d10d

    欢迎关注磐创AI博客站:
    http://panchuang.net/

    sklearn机器学习中文官方文档:
    http://sklearn123.com/

    欢迎关注磐创博客资源汇总站:
    http://docs.panchuang.net/

  • 相关阅读:
    CSP-S 2020 游记
    USACO Mowing the Lawn
    洛谷 P1725 琪露诺
    浅谈单调队列
    浅谈单调栈
    洛谷 P1440 求m区间内的最小值
    POJ 2823 Sliding Window
    洛谷 P1901 发射站
    POJ 2796 Feel Good
    POJ 2559 Largest Rectangle in a Histogram
  • 原文地址:https://www.cnblogs.com/panchuangai/p/13794964.html
Copyright © 2020-2023  润新知