• 作业


    #coding:utf-8
    from HTMLParser import HTMLParser
    import sys
    listCount=[]
    
    class MyHTMLParser(HTMLParser):
    
        #处理开始标签
        def handle_starttag(self, tag, attrs):
            """
            recognize start tag, like <div>
            :param tag:
            :param attrs:
            :return:
            """
    
    
            print("Encountered a start tag:", tag)
    
        #处理结束标签
        def handle_endtag(self, tag):
            """
            recognize end tag, like </div>
            :param tag:
            :return:
            """
            print("Encountered an end tag :", tag)
    
        #处理数据,标签之间的文本,并进行统计
        def handle_data(self, data):
            """
            recognize data, html content string
            :param data:
            :return:
            """
            print("Encountered some data  :", data)
            print('-----------------------------------')
    
            listCount.append(data)
            changdu=len(listCount)
            print listCount
            print changdu
            if changdu==54:
                FailCount=listCount.count('Fail')
                PassCount=listCount.count('Pass')
                print('统计失败的次数为:'+str(FailCount))
                print('统计成功的次数为:'+str(PassCount))
    
            else:
                print('continue')
    
    
        #处理结束的标签
        def handle_startendtag(self, tag, attrs):
            """
            recognize tag that without endtag, like <img />
            :param tag:
            :param attrs:
            :return:
            """
            print("Encountered startendtag :", tag)
    
        #处理注释
        def handle_comment(self,data):
            """
    
            :param data:
            :return:
            """
            print("Encountered comment :", data)
    
    
    #打开html文件并逐行读取然后传给HTMLPrase进行解析
    file=open('123.html','r')
    while 1:
        readFile=file.readline()
        print(readFile)
        parser = MyHTMLParser()
        parser.feed(readFile)
        if not readFile:
            break
    file.close()
    

      

  • 相关阅读:
    用算法合并数组
    Redis各个数据类型的使用场景
    seesion工作原理
    自删除道指令程序
    uva 1335
    《生活在Linux中》之:使用Bash就是使用Emacs
    手动配置S2SH三大框架报错(三)
    数据和C
    IOS之【地图MapKit】
    我工作这几年(五)-- Android学习4.5月总结(一)
  • 原文地址:https://www.cnblogs.com/wjy123/p/7717278.html
Copyright © 2020-2023  润新知