大作业:
1.选择使用什么数据,有哪些字段,多大数据量。
选择美国新冠疫情统计数据。
字段结构为(以前两行为例)
date, county, state, cases, deaths
2020/1/21,Snohomish,Washington, 1, 0
数据大小5MB
2.准备分析哪些问题?(8个以上)
(1).统计截止5.19日,美国各州的累计确诊人数和死亡人数
(2).统计截止5.19日,美国确诊人数最多的十个州,然后按确诊人数升序排列
(3).统计截止5.19日,美国确诊人数最少的十个州,然后按确诊人数降序排列
(4).统计截止5.19日,美国死亡人数最多的十个州,然后按确诊人数升序排列
(5).统计截止5.19日,美国死亡人数最少的十个州,然后按确诊人数降序排列
(6).统计截止5.19日,美国死亡人数最少的州
(7).统计截止5.19日,美国死亡人数最多的州
(8).统计截止5.19日,全美和各州的病死率
(9).统计截止5.19日,全美死亡人数在10000以上的州
3.当前进展。
任务全部完成,代码正确性检查中......