• [java] jsoup 解析网页获取省市区域信息


    到国家统计局抓取数据,

    到该class下解析数据

    /**
     * jsoup解析网页
     * @author xwolf
     * @date 2016-12-13 18:11
     * @since V1.0.0
     */
    public class JsoupUtil {
    
        public static JSONObject parse(String url){
            JSONObject json=new JSONObject();
            URL purl= null;
            try {
                purl = new URL(url);
                Document document=Jsoup.parse(purl,1000);
                Element elements=document.body();
               Elements findEles= elements.getElementsByClass("MsoNormal");
    
               for(Element ele:findEles){
                  Elements langSpans= ele.getElementsByAttribute("lang");
                  Elements  nameSpans=ele.getElementsByAttribute("style");
                   for(int i=0;i<langSpans.size();i++){
                       json.put(langSpans.get(i).text().trim(),nameSpans.get(i).text().trim());
                   }
               }
               return json;
            } catch (Exception e) {
                e.printStackTrace();
            }
              return null;
        }
    
        public static void main(String[] args) {
           JSONObject json= parse("http://www.stats.gov.cn/tjsj/tjbz/xzqhdm/201608/t20160809_1386477.html");
            System.out.println(json.toJSONString());
        }

    返回json,处理入库即可。

    附件:省市区域信息.zip

  • 相关阅读:
    Spring Boot入门
    Spring MVC文件上传和下载
    Spring MVC异常处理
    SpringMVC
    linux(2)
    linux(1)
    白盒测试
    LoadRunner(8)
    LoadRunner(7)
    LoadRunner(6)
  • 原文地址:https://www.cnblogs.com/lonelywolfmoutain/p/6171086.html
Copyright © 2020-2023  润新知