今天使用python的jieba库完成了提取关键词的任务,并且完善了查找地域的算法,除此之外,还完成了数据可视化的第一步,根据省市县展示项目数量。
昨天查找地域的算法中模拟百度地图搜索请求,传递的参数本来有十几个,后来我为了省事一个个尝试精简,简化到只需要两个参数:qt和wd。前者表示调用查询接口,后者传递要查询的单位名称。这种查询默认是在全国范围内查询,但是某些单位在全国范围内能查询出按省市来区分的很多单位,或者根本查不到。前者容易解决,因为返回的json数据中包含省市的代码,只需要在请求中多加一个参数c就可以。后者很麻烦,由于数据都是河北省附近,所以我将c固定为天津的代码332进行查询。最终只有3条数据不能通过百度地图和高德地图查询出来,其中2条是由于本该在其他列的数据混在了单位名称这一列,修改之后就能查到了,另1条地图上没有信息,百度搜索之后找到其位于河北省石家庄市裕华区。