• Python学习笔记——文件


    1. 打开模式

    打开模式

    f = open('F:\codes\python\python\fishc\hhh.txt','r')
    print(f)
    
    <_io.TextIOWrapper name='F:\codes\python\python\fishc\hhh.txt' mode='r' encoding='cp936'>
    

    操作

    2. 读取文件

    # 读取整个文件
    print(f.read())
    
    hhh
    qwe大哥撒谎士大夫汇丰大厦广东省大v发
    hfvkshkhalsfsfslkakjlkdslajfdlk
    
    # 上面第一次使用read()函数使文件指针指向文件末尾,所以此时再读取,结果为空
    print(f.read())
    f.close()
    
    f1 = open('F:\codes\python\python\fishc\hhh.txt')
    # 读取前五个字符
    print(f1.read(5))#注意这里的参数为字符个数,与所占空间无关
    
    hhh
    q
    
    # 可以使用tell()方法获取指针位置
    # 一个中文字符,占两个字节
    print(f1.tell())
    
    6
    
    f2 = open('F:\codes\python\python\fishc\hhh.txt')
    print(f2.read(3))
    # 当以上read()函数遇到换行时,会出现奇怪的东西,暂且把换行符当成两个字符
    print(f2.tell())
    
    hhh
    18446744073709551620
    
    # 移动指针
    f1.seek(4,0)
    print(f1.tell())
    print(f1.read())
    
    4
    
    qwe大哥撒谎士大夫汇丰大厦广东省大v发
    hfvkshkhalsfsfslkakjlkdslajfdlk
    
    # 移动指针
    f1.seek(4,0)
    print(f1.tell())
    # readline()只能读取一整行,若读取到上一行的字符,不会有输出
    print(f1.readline())
    
    4
    
    # 移动指针
    f1.seek(5,0)
    print(f1.tell())
    print(f1.readline())
    
    5
    qwe大哥撒谎士大夫汇丰大厦广东省大v发
    
    # 将从指针开始到文件最后的字符转换成列表的形式
    f1.seek(5,0)
    print(list(f1))
    
    ['qwe大哥撒谎士大夫汇丰大厦广东省大v发
    ', 'hfvkshkhalsfsfslkakjlkdslajfdlk
    ']
    
    # 回到文件开始的位置,将文件逐行打印
    f1.seek(0,0)
    lines = list(f1)
    for each_line in lines:
        print(each_line)
    
    hhh
    
    qwe大哥撒谎士大夫汇丰大厦广东省大v发
    
    hfvkshkhalsfsfslkakjlkdslajfdlk
    
    # 以上方法效率不高,可用如下方法
    f1.seek(0,0)
    for each_line in f1:
        print(each_line)
    
    hhh
    
    qwe大哥撒谎士大夫汇丰大厦广东省大v发
    
    hfvkshkhalsfsfslkakjlkdslajfdlk
    
    f1.close()
    f2.close()
    

    3. 写入文件

    f4 = open('F:\codes\python\python\fishc\test.txt','w')
    f4.write('你好')
    f4.close()
    

    4. 任务:将文件(words.txt)中的数据进行分割,并按照以下规律保存起来:

    • 小甲鱼的对话单独保存为boy_ *.txt的文件(去掉小甲鱼:”)
    • 小客服的对话单独保存为girl_ *.txt的文件(去掉小客服:”)
    • 文件中总共有三段对话,分别保存为boy_ 1.txt,girl_ 1.txt, boy_ 2.txt, girl_ 2.txt,boy_ 3.txt, gril_ 3.txt共6个文件(提示:文件中不同的对话间已经使用 ========= T ”分割)

    对话

    f = open(r'F:codespythonpythonfishcwords.txt','r')
    
    boy = []
    girl = []
    count = 1
    
    for each_line in f:
        if each_line[:6] != '======':
            # 如果不是空行,就进行字符串分割
            if each_line != '
    ':
                role,line_spoken = each_line.split(':',1)
                if role == '小甲鱼':
                    boy.append(line_spoken)
                if role == '小客服':
                    girl.append(line_spoken)
        else:
            # 进行文件的保存操作
            file_name_boy = 'boy_' + str(count) + '.txt'
            file_name_girl = 'girl_' + str(count) + '.txt'
            
            boy_file = open(file_name_boy,'w')
            girl_file = open(file_name_girl,'w')
            
            boy_file.writelines(boy)
            girl_file.writelines(girl)
            
            boy_file.close()
            girl_file.close()
            
            boy = []
            girl = []
            count += 1
    
    # 由于文件中只有两个'========='分隔符
    # 所以第三段对话的数据未保存,则退出循环后再保存一次
    file_name_boy = 'boy_' + str(count) + '.txt'
    file_name_girl = 'girl_' + str(count) + '.txt'
            
    boy_file = open(file_name_boy,'w')
    girl_file = open(file_name_girl,'w')
            
    boy_file.writelines(boy)
    girl_file.writelines(girl)
            
    boy_file.close()
    girl_file.close()
            
    f.close()
    
    
    def save_file(boy,girl,count):
        file_name_boy = 'boy_' + str(count) + '.txt'
        file_name_girl = 'girl_' + str(count) + '.txt'
    
        boy_file = open(file_name_boy,'w')
        girl_file = open(file_name_girl,'w')
    
        boy_file.writelines(boy)
        girl_file.writelines(girl)
    
        boy_file.close()
        girl_file.close()
    
    def split_file(filepath):
        
        f = open(filepath)
    
        boy = []
        girl = []
        count = 1
    
        for each_line in f:
            if each_line[:6] != '======':
                # 如果不是空行,就进行字符串分割
                if each_line != '
    ':
                    role,line_spoken = each_line.split(':',1)
                    if role == '小甲鱼':
                        boy.append(line_spoken)
                    if role == '小客服':
                        girl.append(line_spoken)
            else:
                # 进行文件的保存操作
                save_file(boy,girl,count)
    
                boy = []
                girl = []
                count += 1
    
        save_file(boy,girl,count)
    
        f.close()
    
    # 整个程序只需要调用这句话就可实现
    split_file(r'F:codespythonpythonfishcwords.txt')
    
  • 相关阅读:
    ES6知识点整理之----async----异步遍历器
    ES6知识点整理之----async----实现原理以及与其他异步的比较
    ES6知识点整理之----async----语法
    ES6知识点整理之----async----含义及基本用法
    ES6知识点整理之----Generator----异步
    ES6知识点整理之----Generator----其他
    ES6知识点整理之----Generator----yield*表达式
    ES6知识点整理之----Generator----API
    ES6知识点整理之----Generator----next与for...of
    ES6知识点整理之----Generator----概述
  • 原文地址:https://www.cnblogs.com/nigream/p/11251131.html
Copyright © 2020-2023  润新知