• python 路径操作工具 pathlib,比 os 模块好用太多


    在 python 当中,如果你想控制路径,基本上绕不开 os.path。我希望看完这篇文章以后,熟练使用 python 的你能立刻开始使用 pathlib 模块,一刻也不要耽误。

    pathlib 相对于 os.path 有以下优势:

    • pathlib 导入更加清晰;
    • 采用面向对象编程,能同时存储更多状态,os.path 返回的通常只有一个字符串;
    • pathlib 使用更简单

    获取路径相关信息

    pathlib 会把路径相关信息都存在一个 Path 的核心类里面,比如用户名,后缀名,上层目录,文件创建时间,文件大小等等。 这些 os.path 是没有办法一次性都给我们的,因为 os.path 调用的函数几乎都是返回字符串格式,不能像 Path 对象这样保存状态。

    1, 获取当前文件路径。这种操作方式可能会包含相对路径信息。

    # 获取当前路径
    current_path = Path(__file__)
    print(current_path)
    

    2,当前文件夹路径。

    current_path = Path('.')
    print(current_path)
    

    3, 获取当前文件和文件夹的元信息。

    st = current_path.stat()
    print(st)
    # 文件大小
    print(st.st_size)
    # 文件时间
    print(st.st_atime)
    

    4,Path(‘.’) 这种方式可以包含相对路径 ../doc 等,如果要获取绝对路径要使用 resolve 获取绝对路径。

    current_path.resolve()
    

    如果路径不存在, 是不会抛出异常的。如果想抛出异常,可以设置参数 strict 设为 True,抛出 FileNotFoundError。

    current_path.resolve(strict=True)
    

    5, 获取父目录。这是 os.path 最被人诟病的一点,你需要不停的通过 os.path.dirname() 去获取父目录,层级多了,心都碎了。 在 pathlib 里,因为采用的是对象形式,可以直接通过 parent 属性获取父目录,父目录同时也是一个 Path 对象,照样可以用 parent 去获取目录。

    parent = current_path.parent.parent.parent
    

    6, 如果需要不停的返回上一级目录,不停的 parent 属性也会让人不厌其烦。pathlib 提供了一种更灵活的机制让你去获取高层父目录, 就是 parents 属性。 parents 会把从根目录开始的所有层级都保存起来,直接通过索引获取对应层级就可以了。

    parents = current_path.parent
    
    first_p = parents[0]
    
    second_p = parents[1]
    

    这里有一点非常遗憾,pathlib 没有支持逆向索引,也就是说不能通过 parents[-2] 去达到和 current_path.parent.parent 相同的效果。在实际应用中,这种场景用得还是挺多的,需要通过某个文件获取上层路径,上上层路径。

    # TODO: 可以封装的技能,目前未实现
    parents[-3]
    

    提供一种封装思路:

    def my_parents(self, nagtive_num):
        ....
        return self.parents[len(current_path.parents) + nagtive_num]
    

    还有一种思路,重写源码中的 __getitem__ 方法,这里不做深入阐述。

    7, 获取文件名称

    name = current_path.name
    

    8, 获取文件后缀名。

    file_suffix = current_path.suffix
    

    9,获取不含后缀名的文件名。

    file_without_suffix = current_path.stem
    

    路径操作

    1,with_name, 改变文件名, 生成新路径,实际文件不发生变化.

    # 改变文件名为 new_name.py,生成新路径,实际文件不发生变化
    # 原来的文件名封装在 current_path 对象中
    with_name = current_path.with_name('new_name.py')
    

    2, with_suffix, 改变后缀名。

    # 改变后缀名,生成新路径,实际文件不发生变化
    with_suffix = current_path.with_suffix('.new_suffix')
    

    3, 路径拼接。 pathlib 提供了和 os.path.join() 类似的路径拼接方式:

    new_path = current_path.joinpath('join_path')
    

    更重要的是,他提供了一种更直观的方式 /

    new_path = current_path / 'lemon/yuze' / 'yuze_again'
    

    这种方式的实现原理学过测试开发课程的同学应该很容易想到,定义一个除法运算的魔术方法就可以。

    思考:pathlib 可以完全代替 os.path 吗?

  • 相关阅读:
    CKA易错题整理:五、配置⽹络策略 NetworkPolicy
    CKA易错题整理:第四题:备份还原 etcd
    2022 暑期复健训练(持续更新)
    【其他】STL 容器初始化后占用空间大小测试
    2步 从百度网盘好友分享文件中导出文件目录
    简单易懂的时序数据压缩算法分析
    判断字符串是否可以转成BigDecimal(可转用小数,负数)
    RocketMq
    【leetCode】三数之和
    【leetCode】盛最多水的容器
  • 原文地址:https://www.cnblogs.com/wagyuze/p/11578139.html
Copyright © 2020-2023  润新知