scrapy 提取XML文档 - 润新知

scrapy 提取XML文档

import requests
import scrapy

url = 'http://xml文件的地址'
# 获取 xml 文件
res = requests.get(url)
# 替换，就是这么暴力
text = res.text.replace('<![CDATA[', '').replace(']]>', '')
# 创建一个 Selector 类的实例
sel = scrapy.Selector(text=text)
# 使用 xpath 选择器
year_list = sel.xpath('//year/text()').extract()
相关阅读:
预览graph取消item的value单位自动转换
 Elasticsearch内存分配设置详解
 Linux core 文件介绍
 案例一整套项目打包部署
 Linux删除文件提示Operation not permitted的处理办法
 python优雅获取本机 IP 方法
 nginx open files limits 导致大量错误信息
 excel表格用协程插入到mysql
mysql基本操作
 装饰器
原文地址：https://www.cnblogs.com/louzi/p/10944134.html

Copyright © 2020-2023 润新知