首先要声明,图片的算法有很多,如JPEG算法,SVD对图片的压缩可能并不是最佳选择,这里主要说明SVD可以降维
相对于PAC(主成分分析),SVD(奇异值分解)对数据的列和行都进行了降维,左奇异矩阵可以用于行数的压缩。相对的,右奇异矩阵可以用于列数即特征维度的压缩,也就是我们的PCA降维。
一张二维n*m的灰度图片可以看做是n*m的矩阵,利用SVD可以实现对二维图像的压缩
1、按照灰度图片进行压缩:
#-*- coding: utf-8 -* import numpy as np from PIL import Image def svd_restore(sigma, u, v, K): K = min(len(sigma)-1, K) #当K超过sigma的长度时会造成越界 print 'Now restore the image with %d ranks' % K m = len(u) n = v[0].size SigRecon = np.zeros((m, n)) #新建一int矩阵,储存恢复的灰度图像素 for k in range(K+1): #计算X=u*sigma*v for i in range(m): SigRecon[i] += sigma[k] * u[i][k] * v[k] SigRecon = SigRecon.astype('uint8') #计算得到的矩阵还是float型,需要将其转化为uint8以转为图片 Image.fromarray(SigRecon).save("svd_" + str(K) + "_" +image_file) #保存灰度图 image_file = u'1.jpg' if __name__ == '__main__': im = Image.open(image_file) #打开图像文件 im = im.convert('L') #将原图像转化为灰度图 im.save("Gray_" + image_file) #保存灰度图 w, h = im.size #得到原图的长与宽 dt = np.zeros((w, h), 'uint8') #新建一int矩阵,储存灰度图各像素点数据 for i in range(w): #逐像素点复制,由于直接对im.getdata()进行数据类型转换会有偏差 for j in range(h): dt[i][j] = im.getpixel((i, j)) dt = dt.transpose() #复制过来的图像是原图的翻转,因此将其再次翻转到正常角度 u, sigma, v = np.linalg.svd(dt)#调用numpy库进行SVM u = np.array(u) #转为array格式,方便进行乘法运算 v = np.array(v) #同上 for k in [1, 10, 20, 30, 50, 80, 100, 150, 200, 300, 500]: svd_restore(sigma, u, v, k)#使用前k个奇异值进行恢复
奇异值分别取1, 10, 20, 30, 50, 80, 100, 150, 200, 300, 500的降维压缩效果(原始图片为1.jpg)
2、按照彩色图片进行压缩
#-*- coding: utf-8 -* from PIL import Image import numpy as np def rebuild_img(u, sigma, v, p):#p表示奇异值的百分比 #print p m = len(u) n = len(v) a = np.zeros((m, n)) count = (int)(sum(sigma)) curSum = 0 k = 0 print sigma[0:2],count* p while curSum <= count * p: uk = u[:, k].reshape(m, 1) vk = v[k].reshape(1, n) #print curSum,count,'--------',k a += sigma[k] * np.dot(uk, vk) curSum += sigma[k] k += 1 #print k print 'k:',k a[a < 0] = 0 a[a > 255] = 255 #按照最近距离取整数,并设置参数类型为uint8 return np.rint(a).astype("uint8") if __name__ == '__main__': img = Image.open(u'招商.jpg', 'r') a = np.array(img) #print a[:, :, 0] # u, sigma, v = np.linalg.svd(a[:, :, 0]) # R = rebuild_img(u, sigma, v, 0.9) for p in np.arange(0.1, 1, 0.1): u, sigma, v = np.linalg.svd(a[:, :, 0]) R = rebuild_img(u, sigma, v, p) u, sigma, v = np.linalg.svd(a[:, :, 1]) G = rebuild_img(u, sigma, v, p) u, sigma, v = np.linalg.svd(a[:, :, 2]) B = rebuild_img(u, sigma, v, p) I = np.stack((R, G, B), 2) #保存图片在img文件夹下 Image.fromarray(I).save("aq\svd_" + str(int(p * 100)) + ".jpg")
RGB三个通道信息量均按照按照0.1-0.9压缩的图片对比:
2、matplotlib展示压缩前后对比(灰度)
#-*- coding: utf-8 -* import numpy as np from scipy import ndimage import matplotlib.pyplot as plt def pic_compress(k, pic_array): u, sigma, vt = np.linalg.svd(pic_array) sig = np.eye(k) * sigma[: k] new_pic = np.dot(np.dot(u[:, :k], sig), vt[:k, :]) # 还原图像 size = u.shape[0] * k + sig.shape[0] * sig.shape[1] + k * vt.shape[1] # 压缩后大小 return new_pic, size filename = u"招商.jpg" ori_img = np.array(ndimage.imread(filename, flatten=True)) new_img, size = pic_compress(100, ori_img) print("original size:" + str(ori_img.shape[0] * ori_img.shape[1])) print("compress size:" + str(size)) fig, ax = plt.subplots(1, 2) ax[0].imshow(ori_img) ax[0].set_title("before compress") ax[1].imshow(new_img) ax[1].set_title("after compress") plt.show()
运行效果:
参考文献:
https://my.oschina.net/bgbfbsdchenzheng/blog/687110
https://blog.csdn.net/xuelabizp/article/details/52318708
https://blog.csdn.net/wang454592297/article/details/80999644