读取一张示例图片或自己准备的图片,观察图片存放数据特点。
根据图片的分辨率,可适当降低分辨率。
再用k均值聚类算法,将图片中所有的颜色值做聚类。
然后用聚类中心的颜色代替原来的颜色值。
形成新的图片。
观察原始图片与新图片所占用内存的大小。
将原始图片与新图片保存成文件,观察文件的大小。
from sklearn.datasets import load_sample_image import matplotlib.pyplot as plt from sklearn.cluster import KMeans #load_sample_image包的示例图片加载 Yi = load_sample_image("china.jpg") plt.imshow(Yi) plt.show() print(Yi.shape)
fl = load_sample_image("flower.jpg")#原始图片 plt.imshow(fl) plt.show() print(fl.shape) plt.imshow(fl[:,:,-2]) #改变图片色调,使图片失真 plt.show()
# mtaplotlib加载图片 import matplotlib.image as img bsb = img.imread("E:software packageBabysbreath.jpeg") #读入图片路径 plt.imshow(bsb) plt.show() print(bsb.shape)
bsbth = bsb[::3,::3] #降低分辨率 plt.imshow(bsb) plt.show() n_colors =64 #(256,256,256) Z= bsbth.reshape(-2,6) model= KMeans(n_colors) labels = model.fit_predict(Z) #每个点的颜色分类,0-63 colors = model.cluster_centers_ #64个聚类中心,颜色值 print(bsb.shape,bsbth.shape,Z.shape)
#聚类 import numpy as np n_colors= 64 #(256,256,256) model= KMeans(n_colors) labels = model.fit_predict(Z) #每个点的颜色分类,0-63 colors = model.cluster_centers_ #64个聚类中心,颜色值 # 以colors作为主体,labels作为下标,每个元素都替换成相应类别对应的中心值 new_bsbth = colors[labels] # 还原成原来的维度并转换数据类型 new_bsbth = new_bsbth.reshape(bsbth.shape) plt.imshow(new_bsbth.astype(np.uint8)) plt.show plt.imshow(bsbth); plt.show()
#保存图片 plt.imsave('C:\Users\E5-572\Desktop\bella\bsb.jpg',bsb) plt.imsave('C:\Users\E5-572\Desktop\bella\bsbth.jpg',bsbth) import sys # 压缩前后对比 size1 = sys.getsizeof('C:\Users\E5-572\Desktop\bella\bsb.jpg') size2 = sys.getsizeof('C:\Users\E5-572\Desktop\bella\bsbth.jpg') print('压缩前:'+str(size1)," 压缩后:"+str(size2))
理解贝叶斯定理:
- M桶:7红3黄
- N桶:1红9黄
- 现在:拿出了一个红球
- 试问:这个红球是M、N桶拿出来的概率分别是多少?