前文5.2节和5.4节分别就Python下读文件操作做了基础性讲述和提升性介绍,但是仍有些问题,比如在5.4节里涉及到一个多次读文件的问题,实际上我们还没有完全阐述完毕,下面这个图片的问题在哪呢?
问题在于,为何调用两次readline?文本文件a.txt里我们已知有两行文本,所以我们用两次readline把a.txt文本里的内容全部读取出来了,实际上通常程序是不知道某个文件里有多少行数据的,那怎样编写一个通用的程序无论文件里有多少行我们都可以通过程序把它全部读出来呢?这里需要将文件的读写和循环结合起来,通过循环可以完成对文件的全部读写操作,下面我们就介绍一下在Python里如何通过循环的编程设计方式把文件里的内容全部读取出来。
Python里通过循环读文件通常有两种方法,方法一,判断每次读取的内容,通常读文件读到最后数据为空(即空字符串' '),我们通过while循环判断都会数据是否为空即可判断是否文件全部读取完毕;方法二,使用for循环结构来读取文件内容。
方法一演示:
使用while循环通常在while循环体外部要对判断的变量做一个初始化,在这里在while外部先读一下文件,接着while判断是否读取回有效数据,如果读到了数据则在while体内进行相应的数据处理,之后进行下一次读取文件操作,再之后结束本次while循环;如果没有读到有效数据则不执行while循环体里语句,转而执行while循环下面的其他程序语句。有关while循环可参考“Python学习入门基础教程(learning Python)--4.1 Python的条件循环体while语句”。所读文件a.txt内容如下图所示。
使用while循环读取文件内容代码如下所示:
rfile = open("a.txt", 'r') str = rfile.readline() str = str.rstrip(' ') while str != "": print str str = rfile.readline() str = str.rstrip(' ') print "read finish!" rfile.close()
代码第1行是以读的方式打开程序当前工作目录下的a.txt文件,第2行~3行作用是预读一下文件a.txt和去除str字符串尾部的'
'字符,代码第5~8行是while循环体,循环读取文件里的内容(每次读一行),while首先判断一下(第5行)本次读取时否读到内容?如果读到了有效内容(非空),则打印输出(第6行),再读一下文件(第7行),去除str字符串尾部的'
'字符(第8行),结束本次循环返回代码的第5行,进行下一次循环。程序执行结果如下所示。
方法二演示:
方法二里我们用for循环来读取未知数据行数文件的内容。其语法结构如下所示:
for variable in file_obj: statement1 statement2 etc.
for和文件结合读取文件内容时,for每次从file_obj里取出一条数据(到' ')赋值给variable。 这和我们以前学习的for有些不一样,这是Python高明之处,无需真正的去读文件,无需判断,for一直到读到文件结束时结束循环。多方便多人性啊!
rfile = open("a.txt", 'r') for str in rfile: str = str.rstrip(' ') print str print "read finish!" rfile.close()
程序运行结果如下图所示。
-->