1.pandas.read_csv
总图片数是少一张的,print(n)发现也是少了一个序号
仔细查找后发现缺少99号,即最后一张图片没有被读取。print(m)时也没有99号,再往前推测应当是载入数据时出现错误,print(path)时发现果然是第一行的数据没有读取,被当作了标题。pandas.read_csv(path, sep=' ',header=None) #默认为有标题
正因为没有读取到第一行数据,把后面的1~99读取出来了,但图片特征编号是0~98,所以造成了分类出来的每一个文件夹的第一张都是错的。
2.self.cluster是属性,cluster是变量,变量是不能在外部使用的,
涉及到的文件处理函数,如os.path.join() #路径拼接 .format
newpath=' '/{}.format(key) #[python之字符串格式化(format)l)]
1 for init in os.listdir(root_path): #子文件夹 2 i += 1 6 for name in os.listdir(os.path.join(root_path, init)): 7 #for name in os.listdir(init): #这样写会有部分文件遍历不到,具体原因未知,但改为绝对路径即可解决
6.ModuleNotFoundError: No module named 'caffe.proto'
这个caffe是在当时按照的gluon虚拟环境中的python版本的caffe,import caffe没有出现问题,但是报出了上面的错误。
网上说需要把caffe中的和python有关的路径添加到python的编译路径中去,但是我这个是虚拟环境中的caffe,感觉有些不一样。于是我到虚拟环境中的lib/python3.6/site-packages/caffe2/proto文件夹下看了源码,发现存在caffe2_pb2.py这个脚本文件,于是将import caffe 改为import caffe2,即可解决错误。