作者|Kavya Musty
编译|Flin
来源|medium
我们经常扫描纸张把它们转换成图像。我们有各种各样的工具可以在线增强这些图像,使它们的亮度更亮,并消除这些图像中的阴影。如果我们可以手动去除阴影呢?我们可以将任何图像作为灰度图像加载到我们的代码中,并在几秒钟内获得输出,而无需任何应用程序的帮助。
这可以通过使用基本的Numpy操作和一些open CV函数来实现。为了解释这个过程,我们使用了下面的图片,它是用手机拍的。
很明显,有一个阴影需要删除。让我们开始吧。
- 将必要的软件包导入你的环境。为了易于显示图像,我们使用Jupyter Notebook。
import cv2
import numpy as np
import matplotlib.pyplot as plt
- 删除阴影时,有两件事要注意。由于图像是灰度图像,如果图像背景较浅且对象较暗,则必须先执行最大值滤波,然后再执行最小值滤波。如果图像背景较暗且物体较亮,我们可以先执行最小值滤波,然后再进行最大值滤波。
那么,最大值滤波和最小值滤波到底是什么?
- 最大值滤波:让我们假设我们有一个特定大小的图像 I 。我们编写的算法应逐个遍历 I 的像素,并且对于每个像素(x,y),它必须找到该像素周围的邻域(大小为N x N的窗口)中的最大灰度值,并将该最大灰度值写入A中相应的像素位置(x,y)。所得图像 A 称为输入图像 I 的最大值滤波图像。
让我们在代码中实现这个概念。
-
max_filtering()函数接受输入图像和窗口大小N。
-
它最初在输入数组周围创建一个“wall”(带有-1的填充),当我们遍历边缘像素时会有所帮助。
-
然后,我们创建一个“ temp”变量,将计算出的最大值复制到该变量中。
-
然后,我们遍历数组,并围绕当前像素大小N x N创建一个窗口。
-
然后,我们使用“ amax()”函数在该窗口中计算最大值,并将该值写入temp数组。
-
我们将该临时数组复制到主数组A中,并将其作为输出返回。
-
A是输入I的最大值滤波图像。
def max_filtering(N, I_temp):
wall = np.full((I_temp.shape[0]+(N//2)*2, I_temp.shape[1]+(N//2)*2), -1)
wall[(N//2):wall.shape[0]-(N//2), (N//2):wall.shape[1]-(N//2)] = I_temp.copy()
temp = np.full((I_temp.shape[0]+(N//2)*2, I_temp.shape[1]+(N//2)*2), -1)
for y in range(0,wall.shape[0]):
for x in range(0,wall.shape[1]):
if wall[y,x]!=-1:
window = wall[y-(N//2):y+(N//2)+1,x-(N//2):x+(N//2)+1]
num = np.amax(window)
temp[y,x] = num
A = temp[(N//2):wall.shape[0]-(N//2), (N//2):wall.shape[1]-(N//2)].copy()
return A
- 最小值滤波:此算法与最大值滤波完全相同,但是我们不去找邻近的最大灰度值,而是找到了该像素周围N x N邻近的最小值,并将该最小灰度值写入B中的(x,y)。所得的图像 B 称为图像 I 的经过最小值滤波的图像。
让我们对该函数进行编码。
def min_filtering(N, A):
wall_min = np.full((A.shape[0]+(N//2)*2, A.shape[1]+(N//2)*2), 300)
wall_min[(N//2):wall_min.shape[0]-(N//2), (N//2):wall_min.shape[1]-(N//2)] = A.copy()
temp_min = np.full((A.shape[0]+(N//2)*2, A.shape[1]+(N//2)*2), 300)
for y in range(0,wall_min.shape[0]):
for x in range(0,wall_min.shape[1]):
if wall_min[y,x]!=300:
window_min = wall_min[y-(N//2):y+(N//2)+1,x-(N//2):x+(N//2)+1]
num_min = np.amin(window_min)
temp_min[y,x] = num_min
B = temp_min[(N//2):wall_min.shape[0]-(N//2), (N//2):wall_min.shape[1]-(N//2)].copy()
return B
-
因此,如果图像的背景较浅,我们要先执行最大值滤波,这将为我们提供增强的背景,并将该最大值滤波后的图像传递给最小值滤波函数,该函数将负责实际的内容增强。
-
因此,执行最小-最大值滤波后,我们获得的值不在0-255的范围内。因此,我们必须归一化使用背景减法获得的最终阵列,该方法是用原始图像减去最小最大值滤波后的图像,以获得去除了阴影的最终图像。
#B is the filtered image and I is the original image
def background_subtraction(I, B):
O = I - B
norm_img = cv2.normalize(O, None, 0,255, norm_type=cv2.NORM_MINMAX)
return norm_img
- 变量N(用于过滤的窗口大小)将根据图像中粒子或内容的大小进行更改。对于测试图像,选择大小N = 20。增强后的最终输出图像如下所示:
输出图像是原始图像增强后的结果。所实现的代码是在open CV中手动实现一些库函数以增强图像的拙劣尝试。带有图像的整个notebook可以在下面的Github链接中找到。
原文链接:https://medium.com/swlh/enhancing-gray-scale-images-using-numpy-open-cv-9e6234a4d10d
欢迎关注磐创AI博客站:
http://panchuang.net/
sklearn机器学习中文官方文档:
http://sklearn123.com/
欢迎关注磐创博客资源汇总站:
http://docs.panchuang.net/