• Python之路----文件操作


    文件操作

    1.能调用方法的一定是对象,比如数值、字符串、列表、元组、字典,甚至文件也是对象,Python中一切皆为对象。

    1 str1 = 'hello'
    2 str2 = 'world'
    3 str3 = ' '.join([str1,str2])
    4 print(str3)

    2.三种基本的文件操作模式:r(only-read)、w(only-write)、a(append)

      对文件进行操作的流程:第一,建立文件对象。第二,调用文件方法进行操作。第三,不要忘了关闭文件。(文件不关闭的情况下,内容会放在缓存,虽然Python会在最后自动把内容读到磁盘,但为了以防万一,要养成关闭文件的习惯)

    有文件file1

    1 一张褪色的照片,
    2 好像带给我一点点怀念。
    3 巷尾老爷爷卖的热汤面,
    4 味道弥漫过旧旧的后院;
    5 流浪猫睡熟在摇晃秋千,
    6 夕阳照了一遍他咪着眼;
    7 那张同桌寄的明信片,
    8 安静的躺在课桌的里面。

    (1)r模式

      在只读模式下写入内容会报错。

    1 f = open('file1','r')
    2 f_read = f.read()      #read是逐字符地读取,read可以指定参数,设定需要读取多少字符,无论一个英文字母还是一个汉字都是一个字符。
    3 print(f_read)
    4 f.close()
    1 f = open('file1','r')
    2 f_read = f.readline()  #readline只能读取第一行代码,原理是读取到第一个换行符就停止。
    3 print(f_read)
    4 f.close()
    1 f = open('file1','r')
    2 f_read = f.readlines()  #readlines会把内容以列表的形式输出。
    3 print(f_read)
    4 f.close()
    1 f = open('file1','r')
    2 for line in f.readlines()  #使用for循环可以把内容按字符串输出。
    3     print(line)  #输出一行内容输出一个空行,一行内容一行空格...  因为文件中每行内容后面都有一个换行符,而且print()语句本身就可以换行,如果不想输出空行,就需要使用下面的语句:print(line.strip())
    4 f.close()

    (2)w模式

      在进行操作前,文件中所有内容会被清空。比如在file1中写入'hello world',程序执行后file1中就只剩下一句'hello world'

    1 f = open('file1','w',encoding='utf8')   #由于Python3的默认编码方式是Unicode,所以在写入文件的时候需要调用utf8,以utf8的方式保存,这时pycharm(默认编码方式是utf8)才能正确读取,当读取文件时,文件是utf8格式,pycharm也是utf8,就不需要调用了。
    2 f_w = f.write('hello world')
    3 print(f_w)   #有意思的是,这里并不打印'hello world',只打印写入多少字符
    4 f.close()

    (3)a模式

      与w模式不同的是,a模式不会把原来内容清空,而是光标移到内容最后位置,继续写入新内容。比如在最后追加'hello world'

    1 f = open('file1','a')
    2 f_a = f.write('hello world')
    3 print(f_a)  #还是会打印写入的字符数
    4 f.close()

    打印文件,在'流浪猫睡熟在摇晃秋千'后面加上'helloworld'输出

      r模式时,我们说过用for循环和readlines()输出文件内容,这种输出内容的原理是:打开文件,把全部内容读入内存,然后再打印输入,当文件很大时,这种读取方式就不靠谱了,甚至会使机器崩溃。我们需要及时关闭文件,如下:

     1 f = open('file','r')
     2 data=f.readlines()    #注意及时关闭文件
     3 f.close()
     4 
     5 num = 0
     6 for i in data:
     7     num += 1
     8     if num == 5:
     9         i = ''.join([i.strip(),'hello world'])  #不要使用“+”进行拼接
    10     print(i.strip())
    11 f.close()

    对于大数据文件,要使用下面的方法:

    1 num = 0
    2 f.close()   #不要过早关闭文件,否则程序不能识别操作句柄f.
    3 f = open('file','r')
    4 for i in f:   #for内部把f变为一个迭代器,用一行取一行。
    5     num += 1
    6     if num == 5:
    7         i = ''.join([i.strip(),'hello world'])
    8     print(i.strip())
    9 f.close()

    3.tell和seek

    tell:查询文件中光标位置

    seek:光标定位

     1 f = open('file','r')
     2 print(f.tell())   #光标默认在起始位置
     3 f.seek(10)        #把光标定位到第10个字符之后
     4 print(f.tell())   #输出10
     5 f.close()
     6 ----------------------
     7 f = open('file','w')
     8 print(f.tell())   #先清空内容,光标回到0位置
     9 f.seek(10)        
    10 print(f.tell())
    11 f.close()
    12 ----------------------
    13 f = open('file','a')
    14 print(f.tell())   #光标默认在最后位置
    15 f.write('你好 世界'16 print(f.tell())   #光标向后9个字符,仍在最后位置
    17 f.close()

    4.flush 同步将数据从缓存转移到磁盘

    示例,实现进度条功能

     1 import sys,time   #导入sys和time模块
     2 for i in range(40):
     3     sys.stdout.write('*')
     4     sys.stdout.flush()    #flush的作用相当于照相,拍一张冲洗一张
     5     time.sleep(0.2)
     6 下面代码也能够实现相同的功能
     7 import time 
     8 for i in range(40):
     9     print('*',end='',flush=True)  #print中的flush参数
    10     time.sleep(0.2)

    5.truncate 截断

    不能是r模式下执行,

    w模式下,已经清空所有数据,使用truncate没有任何意义,

    a模式下,截断指定位置后的内容。

    1 f = open('file','a')
    2 f.truncate(6)  #只显示6个字节的内容(6个英文字符或三个汉字),后面的内容被清空。

    6.光标位置总结

      一个汉字两个字节,涉及光标位置的方法有4个:read、tell、seek、truncate。

     1 #--------------------------光标总结head-----------------------------------
     2 f = open('file','r')
     3 print(f.read(6))  #6个字符
     4 print(f.tell())   #位置12字节,一个汉字两个字节
     5 f.close()
     6 
     7 f = open('file','r')
     8 f.seek(6)           #6个字节
     9 print(f.tell())
    10 f.close()
    11 
    12 f = open('file','a')
    13 print(f.tell())   #光标默认在最后位置
    14 f.write('你好 世界')
    15 print(f.tell())   #光标向后9个字节,一个汉字两个字节,仍在最后位置  182-->191
    16 f.close()
    17 
    18 f = open('file','a',encoding='utf-8')
    19 print(f.truncate(6))  #由于需要光标定位位置,所以也是字节。只显示6个字节的内容(6个英文字母或三个汉字,一个汉字两个字节),后面的内容被清空。
    20 f.close()
    21 #-----------------------------光标总结end---------------------------------

     7.另外3种模式:r+、w+、a+

    r+:读写模式,光标默认在起始位置,当需要写入的时候,光标自动移到最后

    w+:写读模式,先清空原内容,再写入,也能够读取

    a+:追加读模式,光标默认在最后位置,直接写入,也能够读取。

     1 f = open('file','a')
     2 print(f.tell())   #末尾207位置
     3 f.close()
     4 
     5 f = open('file','r+')
     6 print(f.tell())    #0位置
     7 print(f.readline())  #读取第一行
     8 f.write('羊小羚')     #光标移到末尾207位置并写入
     9 print(f.tell())   #213位置
    10 f.seek(0)         #光标移到0位置
    11 print(f.readline())   #读取第一行
    12 f.close()

    8.修改文件内容

      思路:由于数据存储机制的关系,我们只能把文件1中的内容读取出来,经过修改后,放到文件2中。

     1 f2 = open('file2','w',encoding='utf8')   #写入的时候必须加utf8
     2 f1 = open('file','r')
     3 num = 0
     4 for line in f1:  #迭代器
     5     num += 1
     6     if num == 5:
     7         line = ''.join([line.strip(),'羊小羚
    '])   #里面就是对字符串进行操作了
     8     f2.write(line)
     9 f1.close()
    10 f2.close()

    9.with语句

      可以同时对多个文件同时操作,当with代码块执行完毕时,会自动关闭文件释放内存资源,不用特意加f.close(),我们通过下面的示例体会with的用法和好处。

      用with语句重写8中的代码

    1 num = 0
    2 with open('file','r') as f1,open('file2','w',encoding='utf8') as f2:
    3     for line in f1:
    4         num += 1
    5         if num == 5:
    6             line = ''.join([line.strip(),'羊小羚'])
    7         f2.write(line)
  • 相关阅读:
    【特效】导航下拉菜单(二级三级都有)
    【特效】移入显示移出隐藏
    【特效】jquery选项卡插件,页面多个选项卡统一调用
    使用MR求解多个矩阵的乘积之后
    由SequenceFile.Writer(key,value)谈toString()方法
    自定义数据类型写入SequenceFile并读出
    hadoop中URI理解
    输入格式CombineFileInput
    分布式缓存DistributedCache的使用
    输入格式MultipleInput
  • 原文地址:https://www.cnblogs.com/yangxiaoling/p/5814548.html
Copyright © 2020-2023  润新知