在做验证码识别时,识别时需要和库里的图片对比,找到最接近的那个图片,然后就行到了用与图片一致的字符命名,获取文件的名称,去将图片的名称读出来作为验证码。以下是我通过网上的资料总结的三种文件遍历的方式,第一种和第二种相似,只是和第三种有一些区别。
首先要获得文件夹的路径,我是对某个文件夹下的文件进行遍历,需要去除文件的后缀,注:num为我创建的一个文件夹
import os # 需要用到os包 s = os.sep # s区分在linux或windows系统下的分割符"/"或"" root = "C:UsersXXXDesktop" + s + "num" + s # 文件路径 mode = [] # 用mode进行去掉后缀的文件名存储。 # 遍历文件的第一种方式: sname = os.listdir(root) # 获取文件夹下文件或文件夹的名称,获取到的sname的格式为('1.jpg')。 for f in sname: fname = os.path.splitext(f) # 对f中的文件名进行分割,分割后显示为['1','jpg'] mode.append(fname[0]) # fname[0],取序列中的第一值,即['1'] # 遍历文件第二种方法(python2支持,python3不支持) def func(args, dire, fis): for f in fis: fname = os.path.splitext(f) # splitext分割文件名和文件后缀 mode.append(fname[0]) os.path.walk(root, func, ()) # 通过调用函数进行文件的遍历,这种方法只能获取到文件夹下的文件名,不能获取到子文件夹下的其他内容 # 使用os.walk-遍历文件的第三种方法: for rt, dirs, files in os.walk(root): # 通过os.walk进行文件遍历,可以获得文件夹下子文件内的内容,dirs为递归查出的所有文件夹,files为递归查出的所有文件 for f in files: fname = os.path.splitext(f) mode.append(fname[0])