• python day03_ 文件处理


    一、文件操作的基本流程

    计算机操作文件的过程

    #1. 打开文件,得到文件句柄并赋值给一个变量
    #2. 通过句柄对文件进行操作
    #3. 关闭文件

    1.文件的打开过程

    # f被程序持有,文件被操作系统持有
    f = open('file.txt', 'r', encoding='utf-8')  # r读文件,文件一定要提前存在
    
    #2. 通过句柄对文件进行操作
    data=f.read()
    #3. 关闭文件 f.close()

    f=open('file.txt','r')的过程分析:
    #1、由应用程序向操作系统发起系统调用open(...)
    #2、操作系统打开该文件,并返回一个文件句柄给应用程序
    #3、应用程序将文件句柄赋值给变量f

    2.操作文件方法

    # 操作文件
    # data = f.read()  # 读所有内容
    # print(data)
    
    # data = f.read(2)  # 读指定字节数或字符数
    # print(data)
    # d1 = f.read(1)  # 在当前位置接着再读1个字节或字符
    # print(d1)
    
    # line = f.readline()  # 读取一行
    # print(line)
    
    # lines = f.readlines()  # 按行,将所有行一次一次读出到list中
    # print(lines)
    
    # 关闭文件
    # f.close()  # 操作系统对文件的持有权一定要在文件操作完毕后释放w = open(r'file.txt', 'w', encoding='utf-8')
    w.write('123\n')
    w.flush()  # 数据量过大时,可以手动将内存中的数据刷新到硬盘中
    w.write('456\n')
    w.writelines(['000\n', '111\n', '222\n'])
    
    # 是否可读可写
    print(w.readable())
    print(w.writable())
    
    w.close()

    # 文件的遍历:

    # 最常用读写
    with open('source', 'r', encoding='utf-8') as f1, open('target', 'w', encoding='utf-8') as f2:
    for line in f1:
    f2.write(line)

    #掌握
    f.read() #读取所有内容,光标移动到文件末尾
    f.readline() #读取一行内容,光标移动到第二行首部
    f.readlines() #读取每一行内容,存放于列表中
    
    f.write('1111\n222\n') #针对文本模式的写,需要自己写换行符
    f.write('1111\n222\n'.encode('utf-8')) #针对b模式的写,需要自己写换行符
    f.writelines(['333\n','444\n']) #文件模式
    f.writelines([bytes('333\n',encoding='utf-8'),'444\n'.encode('utf-8')]) #b模式
    
    #了解
    f.readable() #文件是否可读
    f.writable() #文件是否可读
    f.closed #文件是否关闭
    f.encoding #如果文件打开模式为b,则没有该属性
    f.flush() #立刻将文件内容从内存刷到硬盘
    f.name

    二、文件的操作模式

    主模式:
    r:  文件必须存在的读
    w:  文件无需存在的写,无创建,有清空再写
    a:  文件无需存在的写,无创建,有在文件最后追加写
    
    从模式:
    t:  按文本字符操作数据(默认模式)
    b:  按文本字节操作数据
    +:  可读可写
    
    了解:
    x:新建文件写,如果文件已存在,抛异常
    #1. 打开文件的模式有(默认为文本模式):
    r ,只读模式【默认模式,文件必须存在,不存在则抛出异常】
    w,只写模式【不可读;不存在则创建;存在则清空内容】
    a, 之追加写模式【不可读;不存在则创建;存在则只追加内容】
    
    #2. 对于非文本文件,我们只能使用b模式,"b"表示以字节的方式操作(而所有文件也都是以字节的形式存储的,使用这种模式无需考虑文本文件的字符编码、图片文件的jgp格式、视频文件的avi格式)
    rb 
    wb
    ab
    注:以b方式打开时,读取到的内容是字节类型,写入时也需要提供字节类型,不能指定编码
    
    #3. 了解部分
    "+" 表示可以同时读写某个文件
    r+, 读写【可读,可写】
    w+,写读【可读,可写】
    a+, 写读【可读,可写】

    3.with...open..语法

    # with open语法
    with open('file.txt', 'x', encoding='utf-8') as f:  # 不需要明文书写f.close()
        # data = f.read()
        # print(data)
        print(f.readable())
        print(f.writable())
    
    # 追加模式
    with open('file.txt', 'a', encoding='utf-8') as f:
        f.write('123\n')
        print(123)
        print(123)
        f.write('456\n')
        f.flush()
        f.write('789\n')

    4. 字节方式操作文件

    """
    你好
    好的
    123
    """
    # 注:b操作模式下不需要指定encoding,
    # 原因,因为b可以对所有类型数据进行操作,包含文本/视频/音频等各种文件
    # 而utf-8只是文本文件的编码方式
    # 数据在硬盘中本就以二进制进行存储的,所有b默认操作就是对数据从硬盘到内存的拷贝
    with open('file.txt', 'rb') as f:
        data = f.read()
        print(data)
        # 但如果数据要展现给用户,文本文件就要涉及解码,其他文件需要通过专业工具打开
        print(data.decode('utf-8'))
    
    with open('file.txt', 'ab') as f:
        f.write(b'\n\xe5\x91\xb5\xe5\x91\xb5')
    
    # r+: 从头开始写, a+:从尾开始写, w+:清空写
    with open('file.txt', 'rb+') as f:
        print(f.readable())
        print(f.writable())
        # print(f.read())
        f.write(b'999')

    5.游标操作

    '''
    123
    你好
    456
    '''
    with open('file.txt', 'w', encoding='utf-8') as f:
        f.write('123\n你好\n456\n')
    
    # 大前提: 游标操作一定要在b模式下进行操作,因为游标一定按字节进行偏移
    # seek(偏移量, 操作位置)
    #  操作位置:0,从头开始 1,从当前位置开始 2,从最后开始
    with open('file.txt', 'rt', encoding='utf-8') as f:
        d1 = f.read(7)
        print(d1)
        f.seek(1, 0)
        d2 = f.read(1)
        print(d2)
    # seek()在操作位置为0时,可以兼容t模式,但任然按字节进行偏移
    
    with open('file.txt', 'rb') as f:
        d1 = f.read(14)
        print(d1)
        # f.seek(1, 1)  # 在当前位置往后偏移1个字节
        # f.seek(-1, 1)  # 在当前位置往前偏移1个字节
        f.seek(-3, 2)  # 将鼠标移至到文件末尾,往前偏移3个字节
        d2 = f.read(1)
        print(d2)

    6.文件的修改

    # 文件的修改
    """change.txt
    name:Owen|age:16|gender:God
    """
    # rb+:在当前位置进行覆盖书写
    with open('change.txt', 'rb+') as f:
        f.seek(14, 0)
        print(f.read(2)) # 16
        f.seek(-2, 1)
        f.write(b'16')
    
    # ab+:可以操作游标,但只对读起作用,写任然是最后追加
    with open('change.txt', 'ab+') as f:
        f.seek(14, 0)
        print(f.read(2))
        f.seek(-2, 1)
        print(f.read(2))
        f.write(b'18')
    
    with open('change.txt', 'rb+') as f:
        data = f.read()
        newData = data.decode('utf-8').replace('16', '016')
        f.seek(0, 0)
        f.write(newData.encode('utf-8'))

    7.复制文件

    # 复制文件
    with open('old.txt', 'r', encoding='utf-8') as f1, open('new.txt', 'w', encoding='utf-8') as f2:
        # 文件的循环
        for line in f1:  # 对可读文件对象直接遍历循环,得到的是一行行内容
            print(line)
            f2.write(line)
    
    import os
    with open('001.png', 'rb') as f1, open('002.png', 'wb') as f2:
        for line in f1:
            f2.write(line)
    # 按指定路径将文件删除
    os.remove(r'D:\python周末四期\day03\代码\001.png')

    练习一

    # 练习,利用b模式,编写一个cp工具,要求如下:
      1. 既可以拷贝文本又可以拷贝视频,图片等文件
      2. 用户一旦参数错误,打印命令的正确使用方法,如usage: cp source_file target_file
    #  提示:可以用import sys,然后用sys.argv获取脚本后面跟的参数
    import sys
    if len(sys.argv) != 3:
        print('usage: cp source_file target_file')
        sys.exit()
    
    source_file,target_file=sys.argv[1],sys.argv[2]
    with open(source_file,'rb') as read_f,open(target_file,'wb') as write_f:
        for line in read_f:
            write_f.write(line)
    练习一

    练习二:

    #. 文件a.txt内容:每一行内容分别为商品名字,价钱,个数,求出本次购物花费的总钱数
    apple 10 3
    tesla 100000 1
    mac 3000 2
    lenovo 30000 3
    chicken 10 3

    作业:

    # 作业一:
    # 读取⽂文件内容,分析出所有的账号及对应的密码
    # ⽂文件内容:owen:123456|egon:123qwe|liuxx:000000
    # 结果:
    {
    'owen': '123456',
    'egon': '123qwe',
    'liuxx': '000000'
    }
    # 分析:将⽂文件内容读出,然后按|拆分出 账号:密码 格式的⼦子字符串串,再按:拆分成 账号及密码,存放到字典中
    
    #作业二:
    # 完成登录注册系统(从空文件开始做)
    # 需求分析:
    '''
    1.可以循环登录注册,输入1代表选择登录功能,输入2代表注册功能,输入0代表退出,其他输入代表输入有误,重输
    2.用户的账号密码信息存放在usr.txt⽂文件中,保证用户注册成功后,重启系统,用户信息仍然保存
    3.登录在账号验证通过才输入密码验证登录,账号验证三次失败自动进入注册功能,登录三次验证失败自动退出系统
    4.第一次注册,文件写入 账号:密码 信息,再次注册追加写入 |账号:密码 信息
    # 作业一
    with open('file3.txt','r',encoding='utf-8') as f:
        dic = []
        for line in f:
            line = line.replace('|',' ')
            # print(line)
            for i in line.split():
                i = i.split(':')
                dic.append(i)
                # print(dic)
    db_user = dict(dic)
    print(db_user)
    
    # 作业二
    #读取文件,获取账号密码
    with open('usr.txt','r',encoding='utf-8') as f:
        dic = []
        for line in f:
            line = line.replace('|',' ')
            # print(line)
            for i in line.split():
                i = i.split(':')
                dic.append(i)
                # print(dic)
    db_user = dict(dic)
    
    tag = True
    while tag:
        print("1-->登录   2-->注册  0-->退出")
        choice = ['0','1','2']
        cmd = input("请选择功能:")
        if not cmd or cmd not in choice: continue
        if cmd == '1': #功能判断
            count = 0
            while count < 3:
                username = input("请输入账号:").strip()
                if not username or username not in db_user.keys():  # 判断账号是否存在
                    # print("账号不存在,是否注册")
                    continue
                password = input("请输入密码:").strip()
                if password == db_user[username]: #账号密码匹配,登录成功
                    print("登录成功")
                else:
                    print("账号密码错误")
                    count += 1
            break
        elif cmd == '2':
            re_name = input("请输入账号:").strip()
            # 账号不存在继续输入密码
            if re_name not in db_user.keys():
                while True:
                    re_pass1 = input("请输入密码:")
                    re_pass2 = input("请再次输入密码:")
                    if re_pass1 == re_pass2:  #2次密码正确写入账号密码文件
                        with open('usr.txt','a',encoding='utf-8') as fl:
                            fl.write('|'+ re_name + ':' + re_pass2)
                        print("注册成功")
                        break
                    else:
                        print("2次输入的密码不一致,请重新输入")
            else:
                print("账号已存在")
        elif cmd == '0':
            break
    作业

    练习三

    # 简单秒传案例
    mk = b""
    # 计算得到秒传依据
    with open('002.png', 'rb') as f:
        data = f.read()
        # print(data)
        length = len(data)
        print(length)
        # 设置秒传算法:1.截取的部分字节,2.加密字节的算法
    
        # 1.从头开始读10个字节,中间读10个字节,末尾读10个字节
        # 2.将所有数据进行拼接
        f.seek(0, 0)
        d1 = f.read(10)
        f.seek(length // 2, 0)
        d2 = f.read(10)
        f.seek(-10, 2)
        d3 = f.read(10)
        mk = d1 + d2 + d3
    
    print(mk)
    
    # 实现秒传
    with open('200.png', 'rb') as f:
        new_mk = b''
        f.seek(0, 0)
        new_mk += f.read(10)
        f.seek(length // 2, 0)
        new_mk += f.read(10)
        f.seek(-10, 2)
        new_mk += f.read(10)
        if new_mk == mk:
            print('秒传')
        else:
            print('调用上传方法,进行龟速上传')
    
    # with open('200.png', 'rb+') as f:
    #     f.seek(-7, 2)
    #     f.write(b'12')
    View Code
  • 相关阅读:
    Redis 学习之路 (009)
    树莓派进阶之路 (012)
    树莓派进阶之路 (011)
    树莓派UFW防火墙简单设置
    树莓派进阶之路 (002)
    Redis学习之路(008)- Redis C语言客户端库hiredis文档翻译
    Redis学习之路(007)- Redis学习手册(实例代码)
    树莓派进阶之路 (000)
    Redis学习之路(006)- Redis学习手册(Hashes数据类型)
    Redis学习之路(005)- redis内存数据库C客户端hiredis API 中文说明
  • 原文地址:https://www.cnblogs.com/yangmeichong/p/10635589.html
Copyright © 2020-2023  润新知