python爬虫-爬取天气预报内容

使用requests模块获取网页内容，bs4数据清洗，pands保存数据一般都为csv格式。

import requests
from bs4 import BeautifulSoup
import pandas as pd

def Get_data(url):
    # 请求得到网页内容
    res = requests.get(url)
    # 二进制方式显示网页内容
    html = res.content.decode('gbk')
    # 格式化网页
    soup = BeautifulSoup(html,'html.parser')
    # 使用soup对象find_all所需内容
    tr_list = soup.find_all('tr')
    # 提取需要的数据
    dates = []
    tmp = []
    condiitions = []
    # 清洗数据
    for data in tr_list[1:]:
        rel_data = data.text.split()
        dates.append(rel_data[0])
        tmp.append(''.join(rel_data[3:6]))
        condiitions.append(''.join(rel_data[1:3]))
    Biaoge = pd.DataFrame()
    Biaoge['日期'] = dates
    Biaoge['温度'] = tmp
    Biaoge['天气情况'] = condiitions
    return Biaoge

mounth9 = Get_data('http://www.tianqihoubao.com/lishi/beijing/month/201909.html')
mounth10 = Get_data('http://www.tianqihoubao.com/lishi/beijing/month/201910.html')
mounth11 = Get_data('http://www.tianqihoubao.com/lishi/beijing/month/201911.html')
# 利用pd.concat拼接 9、10、11月份表格为一份
v = pd.concat([mounth9,mounth10,mounth11]).reset_index(drop=True)
# 保存数据为csv格式
v.to_csv('BeiJing.csv',index=False,encoding='utf-8')

天气预报爬虫

相关阅读:
MongoDB学习笔记(五) MongoDB文件存取操作（转）
MongoDB学习笔记(四) 用MongoDB的文档结构描述数据关系（转）
Log4net配置相关
UML 依赖关联聚合组合
亲属称谓
Unity预定义程序集及自定义包编译顺序
For Windows Phone8 phones make sure that the Windows Phone IP Over USB Transport(IpOverUsbSvc) service is running
提升Entityframework效率的几种方法
将RDLC报表工具栏中的英文改为中文
C#函数式程序设计初探——基础理论篇

原文地址：https://www.cnblogs.com/eddycomeon/p/11972188.html