均值是所有训练样本的均值,减去之后再进行训练会提高其速度和精度。
1、caffe下的均值
数据格式是二进制的binaryproto,作者提供了计算均值的文件compute_image_mean,
计算均值时调用:
sudo build/tools/compute_image_mean examples/mnist/mnist_train_lmdb examples/mnist/mean.binaryproto
生成的均值文件保存在mean_binaryproto。
2、python格式下的均值(.npy)
需要首先将其转为二进制的,然后再转成python格式下的,用一个python脚本来实现。
#!/usr/bin/env python
import numpy as np
import sys,caffe
if len(sys.argv)!=3:
print "Usage: python convert_mean.py mean.binaryproto mean.npy"
sys.exit()
blob = caffe.proto.caffe_pb2.BlobProto()
bin_mean = open( sys.argv[1] , 'rb' ).read()//读入mean.binaryproto
blob.ParseFromString(bin_mean)//解析文件内容到blob
//将blob中的均值转化为.py格式,array的shape(mean_number,channel,height,width)
arr = np.array( caffe.io.blobproto_to_array(blob) )
//选择其中一组均值(?),保存
npy_mean = arr[0]
np.save( sys.argv[2] , npy_mean )
将其保存为convert_mean.py,调用
sudo python convert_mean.py mean.binaryproto mean.npy
得到python下的文件mean.npy
参考:http://www.cnblogs.com/denny402/p/5102328.html
http://blog.csdn.net/hyman_yx/article/details/51732656
3、caffe.proto
在2中,出现了caffe.proto,其中定了很多结构化的数据,比如conv层啊,pool层啊。Protobuf是用于数组存储和交换的,
比如一部分写数据进行存储,另一部分进行读写,为了方便操作,将其定义共同的结构化据。
具体可参考:http://blog.csdn.net/qq_16055159/article/details/45115359/