91家纺 - 润新知

91家纺

"""

抓取

解析

存储

"""

import re

import ast

from urllib import parse

from datetime import datetime

import requests

from scrapy import Selector

domain = "http://www.91jf.com/"

def write_txt():

    f = open("a.txt", 'w')

    f.write("hello world")

    f.close()

def get_nodes_json():

    left_menu_text = requests.get("http://www.91jf.com/").text

    sel = Selector(text=left_menu_text)

    all_divs = sel.xpath("//div[@class='class_child_li']//a/@herf")

    #nodes_str_match = re.search(r"(<li><a href=".*>)", left_menu_text)

    print(all_divs)

    #print(nodes_str_match.groups())

    '''

    if nodes_str_match:

        nodes_str = nodes_str_match.group(1).replace("null", "None")

        nodes_list = ast.literal_eval(nodes_str)

        return nodes_list

    return []

    '''

if __name__ == "__main__":

    get_nodes_json()
相关阅读:
开发工具IDEA
了解java 的一角
 枚举类和Random
字符串String和StringBuffer进行字符串拼接的发现
 java里的包装类
 String和StringBuffer的区别
 StringBuffer进行字符串拼接
 Hashmat
第三单元作业总结
 第二单元作业总结
原文地址：https://www.cnblogs.com/dog-and-cat/p/13204277.html

热门文章
ArrayList源码分析-jdk11 (18.9）
讲清责任链模式
 原型模式
 代理模式
 工厂模式
 抽象工厂模式
 模板方法模式
 建造者模式
 数据结构
 File类

Copyright © 2020-2023 润新知