• 文件的高级处理(文件打开模式,控制文件操作方法,控制文件指针移动,文件修改的两种方式)


    一、文件的打开模式分类两大类
    1、控制文件读写操作的模式
    1.1 r:只读(不指定模式下默认的模式):在文件不存在时则报错,文件存在时文件指针跳到文件开头
    f=open('m.txt',mode='rt',encoding='utf-8')
    # res = f.read()
    print(f.readable())#True
    print(f.writable())#False
    f.close()
    1.2 w:只写:在文件不存在时则创建空文件,文件存在时则清空,文件指针跳到文件开头
    f=open('b.txt',mode='wt',encoding='utf-8')
    f.write("你好啊哈哈哈
    ")
    f.write("hello1
    ")
    f.write("hello2
    ")
    f.close()
    1.3 a:只追加写:在文件不存在时则创建空文件,文件存在时也不会清空,文件指针跳到文件末尾
    f=open('c.txt',mode='at',encoding='utf-8')
    f.write("jason:777
    ")#会换行
    f.write("jjj:666
    ")
    f.close()
    总结:w与a的异同
    相同点:在打开了文件不关闭的情况下,连续地写入,新的内容永远跟在老内容之后
    不同点:重新打开文件,w会清空老的内容,而a模式会保留老的内容并且指针跳到文件末尾

    示范1:注册功能
    # 示范1:注册功能
    name = input("your name: ").strip()
    # 做合法性校验:
    # 1、如果输入的用户名包含特殊字符^$&...让用户重新输入
    # 2、如果输入的用户名已经存在也重新输入
    pwd = input("your password: ").strip()
    # 做合法性校验:
    # 1、密码长度
    # 2、如果密码包含特殊字符则重新输入
    f = open('user.txt',mode='at',encoding='utf-8')
    f.write('%s:%s
    ' %(name,pwd))
    f.close()
    示范2:登录功能
    # 示范2:登录功能
    inp_name = input("your name: ").strip()
    inp_pwd = input("your pwd: ").strip()
    
    f = open('user.txt',mode='rt',encoding='utf-8')
    for line in f:
        user,pwd=line.strip('
    ').split(':')#解压赋值
        if inp_name == user and inp_pwd == pwd:
            print('login successful')
            break
    else:
        print('user or password error')
    
    f.close()
    # 升级需求1:同一个账号输错三次则退出
    # 升级需求2:同一个账号输错三次则,该账号则锁定10秒,即便程序被终止,仍然计时

    2、控制文件读写内容的模式
    1.1 t(在不指定的情况下默认的模式):读写都是以str字符串为单位,一定要指定encoding--------只能处理文本文件
    f=open('a.txt',mode='rt',encoding='utf-8')
    f.read()
    f.close()
    1.2 b:读写都是以bytes为单位,一定不能指定encoding参数----------可以处理任意文件
    #r
    f=open('m.txt',mode='rb')
    data=f.read()
    print(data,type(data))#b'hello
    xe4xbdxa0xe5xa5xbd
    123
    
    ' <class 'bytes'>
    print(data.decode('utf-8'))#b模式要解码
    f.close()
    #w
    f=open('m.txt',mode='wb')
    f.write("egon".encode('utf-8'))
    f.close()
    3、 上下文管理with

    with open(...) as f,open(...) as f1:
    f.read()

    4、案例:编写文件拷贝程序

    src_file=input("源文件路径:").strip()
    dst_file=input("目标文件路径:").strip()
    
    with open(r'%s' %src_file,mode='rb') as src_fobj,open(r'%s' %dst_file,mode='wb') as dst_fobj:
        # data=src_fobj.read()
        for line in src_fobj:  # line=第二行内容
            dst_fobj.write(line)

    5、补充模式

    rwa
    tb必须和rwa联用
    +必须与rwa联用:r+、w+、a+ (r+、w+、a+ 它们都可读可写)
    有:
    r+t
    w+t
    a+t
    r+b
    w+b
    a+b

    不指定模式,那么默认的是rt
    with open('a.txt') as f:#默认rt模式
    pass

    with open('a.txt',mode='w+') as f:#默认wt模式
    pass

    二、控制文件操作的其他方法
    1、读相关方法
      readline() :读一行,读完一行之后,光标会转到下一行行首, 占用2个字符
      readlines():相当于内置了for循环,一行一行读出来,把所有内容读出并且返回列表
    with open('a.txt',mode='rt',encoding='utf-8') as f:
        line1=f.readline()
        line2=f.readline()
        line3=f.readline()
        print(line1)
        print(line2)
        print(line3)
    
        lines=[]
        for line in f:
            lines.append(line)
    
        lines=f.readlines()#for循环简写为此行
        print(lines)

    2、写相关方法

    f.write()#一次性写入

    f.writelines()#有个可以被for循环的,把所有写出(写出来跟f.write一样,但底层原理不一样

    with open('b.txt',mode='wt',encoding='utf-8') as f:
        lines=['111
    ','222
    ','333
    ']
        for line in lines:
            f.write(line)
        # f.writelines(lines)#for循环简写成此行
        f.writelines("hello")

    3、其他

    f.flush()#实时把数据刷新到硬盘,一般不要用,涉及到安全性

    f.name #取的是打开文件的路径

    with open(r'a.txt',mode='wt',encoding='utf-8') as f:
        print(f.name) # 取的是打开文件的路径  a.txt
        print(f.closed)#False
        for i in range(100):
            f.write("%s
    " %i)
            f.flush()#实时刷新

    三、控制文件指针的移动

    1、控制文件内指针的移动都是以字节为单位
      只有一种特殊情况,t模式下的read(n),代表的是n个字符,此外代表的全都是字节
    with open('f.txt',mode='rt',encoding='utf-8') as f:
        data=f.read(6) # 6个字符
        print(data)
    
    with open('f.txt',mode='rb') as f:
        # data=f.read(6) # 6个字节
        data=f.read(8) # 8个字节
        print(data.decode('utf-8'))

       2、f.seek(n,模式) # n代表的移动的字节个数

    模式:
    0模式:参照文件的开头开始移动(只有0模式可以在t下使用,1和2模式只能在b下使用)
    ps: f.tell():告诉光标现在所在的位置
    with open('f.txt',mode='rt',encoding='utf-8') as f:
        f.seek(5,0)
        print(f.tell())
        print(f.read())
        print(f.tell())
        print('='*100)
        f.seek(0,0)
        print(f.read())
    1模式:参照指针当前所在的位置
    with open('f.txt',mode='rb') as f:
        f.seek(3,1)
        f.seek(3,1)
        print(f.tell())
        # f.seek(2,1)
        f.seek(5,0)
        print(f.read().decode('utf-8'))
    2模式:参照文件末尾的位置
    with open('f.txt',mode='rb') as f:
        f.seek(0,2)
        f.seek(-3,2)
        # print(f.tell())
        print(f.read().decode('utf-8'))

    ps: a+  f.seek()   指针可以跳到文件末尾

    3、案例:模拟程序记录日志的功能

    import time
    
    for i in range(10000):
        with open('access.log',mode='at',encoding='utf-8') as f:
            t=time.strftime("%Y-%m-%d %H:%M:%S")
            content="egon给刘老师转了%s个亿" %i
    
            msg=f"{t} {content}
    "
            f.write(msg)
        time.sleep(3)

    #time模块介绍

    import time
    
    time.strftime("%Y-%m-%d %H:%M:%S")
    time.sleep(n) #n代表几秒
    4、读取日志程序
    #读取日志程序
    import time
    
    with open('access.log', mode='rb') as f:
        f.seek(0, 2)
    
        while True:
            line = f.readline()
            if len(line) == 0:
                # 没有读到内容
                time.sleep(0.5)
            else:
                print(line.decode('utf-8'), end='')
    5、了解truncate()
    f.truncate(n)从文件开头往后数n个字节保留下来,其余全部删除
    f.truncate()从文件开头往后数指针当前所在的位置,其余全部删除
    with open('f.txt',mode='ab') as f:
        # f.truncate(3)
        # f.seek(-3,2)
        f.truncate()

     6、功能小结

    #掌握
    f.read() #读取所有内容,光标移动到文件末尾
    f.readline() #读取一行内容,光标移动到第二行首部
    f.readlines() #读取每一行内容,存放于列表中
    
    f.write('1111
    222
    ') #针对文本模式的写,需要自己写换行符
    f.write('1111
    222
    '.encode('utf-8')) #针对b模式的写,需要自己写换行符
    f.writelines(['333
    ','444
    ']) #t模式
    f.writelines([bytes('333
    ',encoding='utf-8'),'444
    '.encode('utf-8')]) #b模式
    
    #了解
    f.readable() #文件是否可读
    f.writable() #文件是否可读
    f.closed #文件是否关闭
    f.encoding #如果文件打开模式为b,则没有该属性
    f.flush() #立刻将文件内容从内存刷到硬盘
    f.name #获取打开的文件路径
    del f #回收应用程序级的变量

    四、文件修改的两种方式

    文件对应的是硬盘空间,硬盘都是用新内容覆盖旧内容,没有修改的概念,但是内存是可以修改的

    如何修改文件:
    思路:把硬盘的内容先读入内存,然后在内存中修改完毕后,再覆盖会硬盘
    ------------------------------------------------------------------
    方式一:
    步骤:
    1、先将硬盘中文件的内容全部读入内存,然后在内存中修改完毕得到一个修改好的结果
    2、将修改的结果覆盖回原文件
    优点: 不耗费硬盘
    缺点:耗费内存
    应用:wps,文本编辑器
    with open('a.txt',mode='rt',encoding='utf-8') as f1:
        data=f1.read()
        res=data.replace('lxx','SB')
    
    with open('a.txt',mode='wt',encoding='utf-8') as f2:
        f2.write(res)
    方式二:
    步骤:
    1、循环读取源文件内容,一行行修改一行行写入一个新的临时文件
    2、删除源文件
    3、将临时文件重命名为源文件名
    优点:节省内存
    缺点:耗费硬盘空间
    应用:针对大文件用
    import os
    with open('a.txt',mode='rt',encoding='utf-8') as f1,
            open('.a.txt.swp',mode='wt',encoding='utf-8') as f2:
        for line in f1:
            res=line.replace('SB','lxx')
            f2.write(res)
    
    os.remove('a.txt')
    os.rename('.a.txt.swp','a.txt')
     
  • 相关阅读:
    撒旦撒旦撒
    的释放的是分
    识别真假搜索引擎(搜索蜘蛛)方法(baidu,google,Msn,sogou,soso等)
    [转]Tesseract-OCR (Tesseract的OCR引擎最先由HP实验室于1985年开始研发)
    使用SQLMAP对网站和数据库进行SQL注入攻击
    Kali Linux 安装教程-转
    【教程】如何修改路由表?
    基于comet服务器推送技术(web实时聊天)
    Ghost硬盘对拷
    Web 通信 之 长连接、长轮询(long polling)
  • 原文地址:https://www.cnblogs.com/guojieying/p/13323604.html
Copyright © 2020-2023  润新知