pyecharts模块
简介
Echarts 是一个由百度开源的数据可视化,凭借着良好的交互性,精巧的图表设计,得到了众多开发者的认可。而 Python 是一门富有表达力的语言,很适合用于数据处理。当数据分析遇上数据可视化时,pyecharts 诞生了。
如果想要掌握pyecharts,可以阅读pyecharts中文文档,里面的图表类型和配置项写的非常详细,我就不过多的赘述了
安装pyecharts
安装的命令也非常简单:
测试pyecharts模块
我们可以尝试运行官方文档所给出的几个小例子来测试一下pyecharts模块是否成功安装
打开编辑器,输入并运行以下代码:
若此时在当前目录下生成了一个名为render.html的文件
pyecharts实战:绘制新冠肺炎疫情地图
需求分析
想要制作全球疫情的地图(空气质量图,人口分布图也是同理),首先需要的就是每个国家的疫情数据,比如人数,治愈数,增长数...... 那么我们该如何获取到这些信息呢?
请求数据
我们发现很多app和网页上都会有最新的疫情信息公布,我选取的数据来源是腾讯地图。
首先打开腾讯地图的疫情信息页,可以发现疫情的信息展现在这一页中
获取这些信息的方法有很多种,可以是用表达式提取,也可以抓包分析,我更喜欢的一种方法是抓包分析。
右击《检查》,点击《network》选项卡并刷新界面,看到加载出来很多数据包,找到里面最像列表的一个list数据包
此时发现,这个list数据包正式我们要提取的数据列表,里面的每个键值对都代表着相应的数据,提取到这些键值对就可以获取到所有的数据信息了,再次回到headers,选项卡下面对应的网址就是我们即将请求的网址,这里我们需要注意的是,这个网址对应的请求是post而不是我们经常使用的get
向网页请求数据:
提取数据
我们刚刚请求到的数据格式是字符格式,并不能被我们直接提取到,必须想将字符格式的数据转换为字典格式才可以开始下一步的提取
将变量转化为字典格式后,就要开始提取数据了 提取json类型的数据可以使用取出列表元素的方法来提取,即先遍历列表将每个国家的信息提取出来,再分别从这些条信息中提取到我们想要的数据
提取数据:
处理数据
在得到了国家和人数信息之后,还需要将数据存储到字典中才能传入图表中,这就需要我们手动的转换数据,并储存到字典中
此时打印出来的字典是标准的字典格式,但是这种格式并不是pyecharts所要求的格式,所以还需要一行代码来进行转换
制作可视化地图
在将数据爬取、变换、整理后,所有准备工作都已经做完,下面我们来调用数据实现数据可视化
先写出一个初步的框架来接收内容
运行代码,发现当前文件夹下出现了一个map.html文件,双击运行
看到这个图表之后,发现代码的运行并没有问题,但是数据却没有传到地图中,这是由于pyecharts默认的世界地图中的国家名是英文,所以我们就要传入一个字典来替代掉这些英文
设置可视化地图
生成了地图之后,接下来就是要保证地图的正确性和美观,所以我们要来设置世界地图
地图上显示国家名太多,影响可读性,所以设置为不显示国家名
按照感染人数的不同,给地图添加不同的颜色
代表国家首都的圆点不美观,去掉红点:
设置背景颜色并为网页取名:
到了现在所有的配置已经完成,但是图表要想显示数据还需要传入一个字典来替换掉默认的英文名,具体实现请看下面的完整代码。