在网上看到一篇博客,地址https://www.pyimagesearch.com/2017/03/20/imagenet-vggnet-resnet-inception-xception-keras/,是关于利用keras上预训练的模型进行图像分类的示例,于是我也自己动手运行了一下,效果,一般。
上代码
from keras.applications import ResNet50 from keras.applications import InceptionV3 from keras.applications import Xception # TensorFlow ONLY from keras.applications import VGG16 from keras.applications import VGG19 from keras.applications import imagenet_utils from keras.applications.inception_v3 import preprocess_input from keras.preprocessing.image import img_to_array from keras.preprocessing.image import load_img import numpy as np model_xception = Xception(weights="imagenet") model_vgg16 = VGG16(weights="imagenet") model_vgg19 = VGG19(weights="imagenet") model_resnet50 = ResNet50(weights = "imagenet") model_inceptionv3 = InceptionV3(weights="imagenet") image = load_img("./images/cat.jpeg",target_size=(224,224)) image = img_to_array(image) image = np.expand_dims(image, axis=0) preds = model_xception.predict(image) P = imagenet_utils.decode_predictions(preds) print(P)
代码与博客相比有轻微改动,所做的事很简单,就是加载模型及权重,第一次加载权重的时候会从网上下载,速度还是挺快的,vgg16和vgg19稍慢,因为两个的权重都有五百多兆,其它模型在90兆左右。然后加载图像,注意拓展一下维度(也就是代表样本数的维度),之后就可以调用predic方法预测,输出十个(1,1000)的张量,最后调用imagenet_utils模块将输出与类别建立映射。
看下结果,加载一张猫的图片,vgg与resnet都可以判断出猫类,inception和xception分别预测pitcher和mixing_bowl,有点离谱。
再加载一个足球的图片,vgg与resnet都正确预测足球,inception与xception预测abacus和pitcher,无语。
再加载一张哈士奇,vgg预测爱斯基摩犬,resnet预测哈士奇,另外两个依然很迷。
此时,我无比怀疑inception系列到底是怎么在imagenet上取得好成绩的,这预测根本不靠谱。
后来,我注意到对于inception或xception,原博客有一步预处理,是inception自带的,经过预处理后,一下子就很准确了。具体来说就是下面这条语句。
image = preprocess(image)
里面究竟发生了什么,以后我会研究一下。