• Python基础之文件目录操作


    概述

    I/O操作不仅包括屏幕输入输出,还包括文件的读取与写入,Python提供了很多必要的方法和功能,进行文件及文件夹的相关操作。本文主要通过两个简单的小例子,简述Python在文件夹及文件的应用,仅供学习分享使用,如有不足之处,还请指正。

    涉及知识点

    1. os模块:os 模块提供了非常丰富的方法用来处理文件和目录。
    2. open方法:open方法用于打开一个文件,用于读取和写入。

    实例1:获取指定目录下所有的文件大小,并找出最大文件及最小文件

    分解步骤:

    1. 遍历文件夹下所有的子文件及子文件夹(需要递归),并计算每一个文件的大小
    2. 计算所有文件的大小总和
    3. 找出最大文件及最小文件

    核心代码

    定义一个方法get_file_size,获取单个文件的大小,单位有KB和MB两种。关键点如下所示:

    1. os.path.getsize 用于获取指定文件的大小,单位是Byte。
    2. round为四舍五入函数,保留指定位数的小数。
     1 def get_file_size(file_path, KB=False, MB=False):
     2     """获取文件大小"""
     3     size = os.path.getsize(file_path)
     4     if KB:
     5         size = round(size / 1024, 2)
     6     elif MB:
     7         size = round(size / 1024 * 1024, 2)
     8     else:
     9         size = size
    10     return size

    定义一个方法list_files,遍历指定文件目录,并存入字典当中。关键点如下所示:

    1. os.path.isfile 用于判断给定的路径是文件还是文件夹。
    2. os.listdir 用于获取指定目录下所有的文件及文件夹,返回一个列表,但是只是当前文件夹的名称,并不是全路径。
    3. os.path.join 用于拼接两个路径
     1 def list_files(root_dir):
     2     """遍历文件"""
     3     if os.path.isfile(root_dir):  # 如果是文件
     4         size = get_file_size(root_dir, KB=True)
     5         file_dict[root_dir] = size
     6     else:
     7         # 如果是文件夹,则遍历
     8         for f in os.listdir(root_dir):
     9             # 拼接路径
    10             file_path = os.path.join(root_dir, f)
    11             if os.path.isfile(file_path):
    12                 # 如果是一个文件
    13                 size = get_file_size(file_path, KB=True)
    14                 file_dict[file_path] = size
    15             else:
    16                 list_files(file_path)

    计算总大小和最大文件及最小文件,如下所示:

    通过比较字典value的大小,返回对应的key的名称。关键点如下所示:

    1. max_file = max(file_dict, key=lambda x: file_dict[x])
    2. min_file = min(file_dict, key=lambda x: file_dict[x])
     1 if __name__ == '__main__':
     2     list_files(root_dir)
     3     # print( len(file_dict))
     4     # 计算文件目录大小
     5     total_size = 0
     6     # 遍历字典的key
     7     for file in file_dict:
     8         total_size += file_dict[file]
     9 
    10     print('total size is : %.2f' % total_size)
    11     # 找最大最小文件
    12     max_file = max(file_dict, key=lambda x: file_dict[x])
    13     min_file = min(file_dict, key=lambda x: file_dict[x])
    14     print('max file is : ', max_file, '
     file size is :', file_dict[max_file])
    15     print('min file is : ', min_file, '
     file size is :', file_dict[min_file])

    实例2:将两个文本文件中的内容进行合并,并保存到文件中

    两个文件内容,如下图所示:

    分解步骤:

    1. 读取两个文件中的内容并进行解析出key和value,存入字典当中(两个字典,分别存储两个文件的内容)。
    2. 遍历第1个字典,并查找第2个字典当中相同key的值,如不存在,则只显示第1个内容,如存在,则进行合并。
    3. 遍历第2个字典,并查找不在第1个字典当中的key的值,进行累加。
    4. 将拼接后的列表存入文件当中。

    核心代码

    定义一个函数read_book,用于读取两个文件的内容。关键点如下所示:

    1. open函数用于打开一个文件,文件编码为UTF-8。
    2. readlines用于读取所有的行,并返回一个列表。
    3. split用于分割字符串为数组。
     1 def read_book():
     2     """读取内容"""
     3     # 读取一个文件
     4     file1 = open('book1.txt', 'r', encoding='UTF-8')
     5     lines1 = file1.readlines()
     6     file1.close()
     7     for line in lines1:
     8         line = line.strip()  # 去空白
     9         content = line.split(',')
    10         book1[content[0]] = content[1]
    11 
    12     # 另一种方式,读取另一个文件,不需要close,会自动关闭
    13     with open('book2.txt', 'r', encoding='UTF-8') as file2:
    14         lines2 = file2.readlines()
    15     for line in lines2:
    16         line = line.strip()  # 去空白
    17         content = line.split(',')
    18         book2[content[0]] = content[1]

    定义一个函数,用于合并内容,并保存。关键点如下所示:

    1. append 用于为数组添加新元素。
    2. dict.keys函数 用于返回所有的key。
    3. join函数用于将数组转换成字符串,并以对应字符分割。
    4. writelines 用于写入所有的行到文件。
    5. with语法,当执行结束时,自动close,并释放资源。
     1 def merge_book():
     2     """合并内容"""
     3     lines = []  # 定义一个空列表
     4     header = '姓名	 电话	 文本
    '
     5     lines.append(header)
     6     # 遍历第一个字典
     7     for key in book1:
     8         line = ''
     9         if key in book2.keys():
    10             line = line + '	'.join([key, book1[key], book2[key]])
    11             line += '
    '
    12         else:
    13             line = line + '	'.join([key, book1[key], ' *****'])
    14             line += '
    '
    15         lines.append(line)
    16     # 遍历第2个,将不包含在第1个里面的写入
    17     for key in book2:
    18         line = ''
    19         if key not in book1.keys():
    20             line = line + '	'.join([key, ' *****', book2[key]])
    21             line += '
    '
    22             lines.append(line)
    23     # 写入book3
    24     with open('book3.txt', 'w', encoding='UTF-8') as f:
    25         f.writelines(lines)

    整体调用,如下所示:

    1 if __name__ == '__main__':
    2     # 读取内容
    3     read_book()
    4     # 合并内容
    5     merge_book()
    6 
    7     # print(book1)
    8     # print(book2)

    最后拼接后生成的文件,如下所示:

    通过以上两个例子,可以大致了解文件及目录操作的一些方法及步骤。

    备注

    西江月·夜行黄沙道中

    [宋]辛弃疾

    明月别枝惊鹊,清风半夜鸣蝉。稻花香里说丰年,听取蛙声一片。
    七八个星天外,两三点雨山前。旧时茅店社林边,路转溪桥忽见。

  • 相关阅读:
    【Python图像特征的音乐序列生成】解析ABC格式的文件(修改版)
    【Python图像特征的音乐序列生成】关于数据库到底在哪里下载
    假期周进度报告2
    假期周进度报告1
    河北省科技创新平台系统头脑风暴会
    问题账户需求分析
    2018年春季个人阅读计划
    软件需求与分析读后感
    《需求工程——软件建模与分析》读后感3
    《需求工程——软件建模与分析》读后感2
  • 原文地址:https://www.cnblogs.com/hsiang/p/13126403.html
Copyright © 2020-2023  润新知