• httpclient解析gzip网页


    请求时加上:getHC.setRequestHeader("Accept-Encoding","gzip, deflate");

    解析时

    String acceptEncoding = "";
         if(getHC.getResponseHeader("Content-Encoding")!=null)
          acceptEncoding = getHC.getResponseHeader("Content-Encoding").getValue();
         StringBuffer sb =new StringBuffer();
         log.debug("acceptEncoding:"+acceptEncoding);
         if(acceptEncoding.toLowerCase().indexOf("gzip") > -1)
         {
          //建立gzip解压工作流
          InputStream is = getHC.getResponseBodyAsStream();
          GZIPInputStream gzin = new GZIPInputStream(is);
          InputStreamReader isr = new InputStreamReader(gzin, charset); // 设置读取流的编码格式,自定义编码
          java.io.BufferedReader br = new java.io.BufferedReader(isr);
          String tempbf;
          while((tempbf=br.readLine())!=null){
           sb.append(tempbf);
           sb.append("\r\n");
          }
          isr.close();
          gzin.close();

         }
         else
         {
          InputStreamReader isr = new InputStreamReader(getHC.getResponseBodyAsStream(), charset); // 设置读取流的编码格式,自定义编码
          java.io.BufferedReader br = new java.io.BufferedReader(isr);
          String tempbf;
          while((tempbf=br.readLine())!=null){
           sb.append(tempbf);
           sb.append("\r\n");
          }
          isr.close();
         }
         getHC.abort();
         getHC.releaseConnection();
         ((SimpleHttpConnectionManager)httpClient.getHttpConnectionManager()).shutdown();

  • 相关阅读:
    [TJOI2013]单词 AC 自动机
    NOIP 2017 逛公园 记忆化搜索 最短路 好题
    [BJWC2012]冻结 分层图最短路
    dijkstra STL 堆优化
    [POI2002][HAOI2007]反素数 数论 搜索 好题
    bzoj 2456: mode 思维题 好题
    [SDOI2012]Longge的问题 欧拉反演_欧拉函数
    [JLOI2011]飞行路线 分层图最短路
    页面加速优化
    制作html5微信页面的经验总结。
  • 原文地址:https://www.cnblogs.com/yesun/p/1323432.html
Copyright © 2020-2023  润新知