数据源样式如下所示:
需求:
读取文本,以第一列为基准参考系,每个基准仅输出满足需要条数的数据;不满足,全部输出。
比如,基准为 6236683970000018780,输出条数要求为 5。若文本中含有 6236683970000018780 多于 5 条,则仅输出前 5 条; 若不超过 5 条,则全部输出。
代码实现如下所示:
#!/usr/bin/python # -*- coding: UTF-8 -*- f = open("test.txt","r") line = f.readline() line = line[:-1] dict = {} count = 0 while line: line = f.readline() line = line[:-1] key = line.split(',')[:1][0] if key in dict.keys(): dict[key] = dict[key] + 1 if dict[key] > 8 and dict[key] < 15: print(line) count = count + 1 else: dict[key] = 1 # count = count + 1 f.close() print(count)
在实际使用过程中,还可对上述脚本进行功能和逻辑方面的扩展,以更好的适用于各种应用场景。