• 制作世界人口地图:JSON格式


    1.提取2010世界人口数据

    先查看json文件数据:

    这个文件实际上就是一个很长的Python列表,其中每个元素都是一个包含四个键的字典:国家名、国别吗、年份以及表示人口数量的值。

    我们尝试打印每个国家2010年的人口数量:

    import json
    
    filename="population_data.json"
    with open(filename) as f:
        pop_data=json.load(f)
        
    for pop_dict in pop_data:
        if pop_dict['Year']=='2010':
            country_name=pop_dict['Country Name']
            population=pop_dict['Value']
            print(country_name+': '+population)

    接下来,我们要将数据转化为Pygal能够处理的格式。

    2.将字符串转化为数字值

    Python不能直接将包含小数点的字符串转化为整数,为消除这种错误我们可以先将字符串转换为浮点数,再讲浮点数转换为小数:

    population=int(float(pop_dict['Value']))
    print(country_name+': '+str(population))

    可以发现High income的小数被丢弃了。

    3.获取两个字母的国别码

    Pygal中的地图制作工具要求数据为特定的格式:用国别码表示国家,以及用数字表示人口数量。

    因为Pygal使用两个字母的国别码,所以我们需要想办法根据国家名获取两个字母的国别码。

    字典COUNTRIES包含的键值分别为两个字母的国别码和国家名,我们可以从模块i18n中导入这个字典,并打印其键和值:

    from pygal_maps_world.i18n import COUNTRIES
    
    for country_code in sorted(COUNTRIES.keys()):
        print(country_code,COUNTRIES[country_code])

    编写一个获取国别码的函数放在名为country_codes的模块中:

    from pygal_maps_world.i18n import COUNTRIES
    
    def get_country_code(country_name):
        for code,name in COUNTRIES.items():
            if name==country_name:
                return code
        return None

    修改打印人口数量的代码:

    import json
    
    from country_codes import get_country_code
    
    filename="population_data.json"
    with open(filename) as f:
        pop_data=json.load(f)
        
    for pop_dict in pop_data:
        if pop_dict['Year']=='2010':
            country_name=pop_dict['Country Name']
            population=int(float(pop_dict['Value']))
            code=get_country_code(country_name)
            if code:
                print(code + ': '+str(population))
            else:
                print('ERROR - ' + country_name)

    导致显示错误消息的原因有两个。首先并非所有人口数量对应的都是国家,有些人口数量对应的是地区(阿拉伯世界)和经济类群(所有收入水平),其次有些统计数据使用了不同的完整国家名。

    4.制作世界地图

    import pygal.maps.world
    
    wm = pygal.maps.world.World()
    wm.title = 'North, Central, and South America'
    
    wm.add('North America', ['ca', 'mx', 'us'])
    wm.add('Central America', ['bz', 'cr', 'gt', 'hn', 'ni', 'pa', 'sv'])
    wm.add('South America', ['ar', 'bo', 'br', 'cl', 'co', 'ec', 'gf',
        'gy', 'pe', 'py', 'sr', 'uy', 've'])
        
    wm.render_to_file('americas.svg')

    方法add()接受一个标签和一个列表,其中后者包含我们要突出的国家的国别码。

    每次调用用add()都将为指定的国家选择一种新颜色,并在图表左边显示该颜色和指定的标签。

    5.绘制完整的世界人口地图

    import json
    
    import pygal.maps.world
    
    from country_codes import get_country_code
    
    filename="population_data.json"
    with open(filename) as f:
        pop_data=json.load(f)
        
    cc_populations={}
    for pop_dict in pop_data:
        if pop_dict['Year']=='2010':
            country_name=pop_dict['Country Name']
            population=int(float(pop_dict['Value']))
            code=get_country_code(country_name)
            if code:
                cc_populations[code]=population
                
    wm=pygal.maps.world.World()
    wm.title="World Population in 2010,by Country"
    wm.add('2010',cc_populations)
    
    wm.render_to_file('World_population.svg')

    有几个国家没有相关数据,我们将其显示为白色,但对于大多数国家,都根据其人口数量进行了着色。

    当前地图中,很多国家都是浅色的,只有两个国家是深色的。对大多数国家而言,颜色深浅差别不足以反映其人口数量的差别。

    为修复这种问题,我们将根据人口数量将国家分组,再分别对每个组着色:

    cc_pops_1,cc_pops_2,cc_pops_3={},{},{}
    for cc,pop in cc_populations.items():
        if pop<10000000:
            cc_pops_1[cc]=pop
        elif pop<100000000:
            cc_pops_2[cc]=pop
        else:
            cc_pops_3[cc]=pop

    6.使用Pygal设置世界地图的样式

    我们从模块中导入了样式RotateStyle,创建这个实例时,需要提供一个参数--十六进制的RGB颜色。

    十六进制格式的RGB颜色是一个以井号(#)打头的字符串,后面跟着6个字符,其中前两个表示红色分量,接下来是绿色和蓝色。

    这里使用的颜色值(#336699)混合了少量的红色(33)、多一些的绿色(66)和更多一些的蓝色(99),它为RotateStyle提供了一种淡蓝色基色。

    加亮颜色主题

    Pygal通常默认使用较暗的颜色主题,为方便印刷,我们使用LightColorizedStyle加亮了地图颜色。

    这个类修改整个图表的主题,包括背景色、标签以及各个国家的颜色:

    from pygal.style import LightColorizedStyle
    
    wm_style=LightColorizedStyle

    使用这个类时,不能直接控制使用的颜色,Pygal将选择默认的基色,要设置颜色,可使用RotateStyle,并将LightColorizedStyle作为基本样式。

    完整代码:

    import json
    
    import pygal.maps.world
    from pygal.style import RotateStyle,LightColorizedStyle
    
    from country_codes import get_country_code
    
    filename="population_data.json"
    with open(filename) as f:
        pop_data=json.load(f)
        
    cc_populations={}
    for pop_dict in pop_data:
        if pop_dict['Year']=='2010':
            country_name=pop_dict['Country Name']
            population=int(float(pop_dict['Value']))
            code=get_country_code(country_name)
            if code:
                cc_populations[code]=population
                
    cc_pops_1,cc_pops_2,cc_pops_3={},{},{}
    for cc,pop in cc_populations.items():
        if pop<10000000:
            cc_pops_1[cc]=pop
        elif pop<100000000:
            cc_pops_2[cc]=pop
        else:
            cc_pops_3[cc]=pop
            
    print(len(cc_pops_1),len(cc_pops_2),len(cc_pops_3))
    
    wm_style=RotateStyle('#336699',base_style=LightColorizedStyle)            
    wm=pygal.maps.world.World(style=wm_style)
    wm.title="World Population in 2010,by Country"
    wm.add('0-10m',cc_pops_1)
    wm.add('10m-1bn',cc_pops_2)
    wm.add('>1bn',cc_pops_3)
    
    wm.render_to_file('World_population.svg')

  • 相关阅读:
    1053: 正弦函数
    1052: 数列求和4
    1051: 平方根的和
    1050: 阶乘的累加和
    POJ 1321 棋盘问题(搜索的方式)
    HDU 1176 免费馅饼
    BZOJ 2423 (求LCS的长度和种类数)
    HDU 2612 (2次BFS,有点小细节)
    POJ 1088 滑雪(模板题 DFS+记忆化)
    HRBUST 1186 青蛙过河 (思路错了)
  • 原文地址:https://www.cnblogs.com/exciting/p/9017396.html
Copyright © 2020-2023  润新知