• #小练习 从多个文件中提取* 分类: python 小练习 正则表达式 20130528 15:40 442人阅读 评论(0) 收藏


    import sys,glob,re,fileinput

    pattern = r'(\d{3})\D*(\d{3})\D*(\d{4})\D*(\d*)$'

    '''
    测试数据:
    800-555-1212
    800 555 1212
    800.555.1212
    (800) 555-1212
    1-800-555-1212
    800-555-1212-1234
    800-555-1212x1234
    800-555-1212 ext. 1234
    work 1-(800) 555.1212 #1234
    '''
    for line in fileinput.input(glob.glob(r'D:\test\*.txt')):#使用glob模块遍历txt文件,返回多个files
        line=line.strip()
        tag = re.search(pattern,line)

        if fileinput.isfirstline():#如果是文件第一行,输出文件名
            sys.stdout.write('--reading %s \n' % fileinput.filename())
        if tag:
            print fileinput.filelineno(),line,tag.groups()#找到匹配的内容,则输出行号、行数据、组


    fileinput.close() #关闭这个内部对象



    版权声明:本文为博主原创文章,未经博主允许不得转载。

  • 相关阅读:
    MySQL
    php抽象类和接口
    php面向对象三大特征
    php面向对象
    Git
    css3属性
    数据渲染
    ajax(2)
    ajax笔记
    作用域面试题
  • 原文地址:https://www.cnblogs.com/think1988/p/4628179.html
Copyright © 2020-2023  润新知