• 91家纺


    """
    抓取
    解析
    存储
    """
    import re
    import ast
    from urllib import parse
    from datetime import datetime

    import requests
    from scrapy import Selector

    domain = "http://www.91jf.com/"

    def write_txt():
        f = open("a.txt", 'w')
        f.write("hello world")
        f.close()

    def get_nodes_json():
        left_menu_text = requests.get("http://www.91jf.com/").text
        sel = Selector(text=left_menu_text)
        all_divs = sel.xpath("//div[@class='class_child_li']//a/@herf")
        #nodes_str_match = re.search(r"(<li><a href=".*>)", left_menu_text)
        print(all_divs)
        #print(nodes_str_match.groups())
        '''
        if nodes_str_match:
            nodes_str = nodes_str_match.group(1).replace("null", "None")
            nodes_list = ast.literal_eval(nodes_str)
            return nodes_list
        return []
        '''

    if __name__ == "__main__":
        get_nodes_json()
  • 相关阅读:
    开发工具IDEA
    了解java 的一角
    枚举类和Random
    字符串String和StringBuffer进行字符串拼接的发现
    java里的包装类
    String和StringBuffer的区别
    StringBuffer进行字符串拼接
    Hashmat
    第三单元作业总结
    第二单元作业总结
  • 原文地址:https://www.cnblogs.com/dog-and-cat/p/13204277.html
Copyright © 2020-2023  润新知