# -*- coding:utf-8 -*- #将所有TXT连接成一个,并删除掉重复记录 import os import time def BianLi(rootDir): print "开始拼接数据,请稍等..." start_time = time.time() fh = open('C://Users//Administrator//PycharmProjects//···//ALL.txt', "w") list1=[] for root,dirs,files in os.walk(rootDir): for filename in files: #这里得到的filename只是一个文件名的字符串而已,如:test.txt filepath = rootDir+filename #拼接目录和文件名得到完整路径 file = open(filepath, 'r') for i in file: #i即为file中的一行,不用再readline()了 line = str(i).strip() print str(line) if line in list1: #判断list里面是否有这个记录了,如果没有就加入list,如果有就跳过 continue else: list1.append(line) #向list里添加记录 fh.write(line+' ') fh.close() end_time = time.time() print "全部数据拼接完毕,用时%.2f秒" % (end_time - start_time) rootDir = 'C://Users//Administrator//PycharmProjects//···//test//' BianLi(rootDir) #调用方法