• htmilunit-- 针对抓取js生成的数据


    public static String  getHtml(String html){
            // 模拟一个浏览器  
            @SuppressWarnings("resource")
            WebClient webClient = new WebClient();  
            //webclient参数载体  
            WebClientOptions clientOptions = webClient.getOptions();  
            // 设置webClient的相关参数  
            clientOptions.setJavaScriptEnabled(true);  
            clientOptions.setCssEnabled(false);  
            webClient.setAjaxController(new NicelyResynchronizingAjaxController());  
            clientOptions.setTimeout(35000);  
            clientOptions.setThrowExceptionOnScriptError(false);  
            // 模拟浏览器打开一个目标网址  
            HtmlPage rootPage = null;
            try {
                rootPage = webClient.getPage(html);
            } catch (FailingHttpStatusCodeException e) {
                // TODO Auto-generated catch block
                e.printStackTrace();
            } catch (MalformedURLException e) {
                // TODO Auto-generated catch block
                e.printStackTrace();
            } catch (IOException e) {
                // TODO Auto-generated catch block
                e.printStackTrace();
            }  
               //body html信息  
            HtmlElement htmlElement = rootPage.getBody();  
            String xmlContent = htmlElement.asXml();  
            return xmlContent;
    }

  • 相关阅读:
    js get set访问器及日期扩展?
    js中加“var”和不加“var”的区别
    面试题
    ajax复习
    artTemplate使用
    Angular2组件开发—属性与事件(一)
    Angular2组件开发—为模板应用样式(三)
    Angular2组件开发—为模板应用样式(二)
    Angular2组件开发—为模板应用样式(一)
    Angular2组件开发—模板的逻辑控制(三)
  • 原文地址:https://www.cnblogs.com/lixiuming521125/p/7058621.html
Copyright © 2020-2023  润新知