• Delphi取Ajax网页内容


    在程序中使用TWebbrowser控件或者Indy中控件连接采用Ajax技术的网页,获得的网页源码中并不会有客户端更新的内容。在IE浏览器中的查看源文件同理也是看不到Ajax更新的内容。通过插件可以看到Ajax更新后的内容。问题是在程序中怎样来获得完整的网页内容?

    如果有Ajax更新,Webbrowser的DocumentComplete事件也不会被触发。

    其实完整的网页内容并不是不可以获得,使用一个简单的方法就可以:

    function GetHtml(const WebBrowser:TWebBrowser): string;
    var
      Doc: IHTMLDocument2;
    begin
      Doc := WebBrowser.Document as IHTMLDocument2;
      if Assigned(Doc) and Assigned(Doc.body) then
        Result := Doc.body.OuterHtml; //也可以用innerHTML取得其HTML文本
    end;

    这样获得的HTML内容中就包含了Ajax更新的内容。

    现在关键是没有好的办法来判断Ajax是否已更新完毕,由于采用的是异步更新,所以在判断上比较困难。上网搜索了一下,国外好像有比较复杂解决方案的,也没有研究过究竟可行否。

    做过网页内容采集软件的,不知道有没有好的办法来处理,欢迎指教。  :-)

  • 相关阅读:
    PAT 1053 住房空置率
    PAT 1078 字符串压缩与解压
    PAT 1024 科学计数法
    HDU 2078 复习时间
    HDU 2065 "红色病毒"问题
    网络协议分析
    多线程同步
    多线程程序设计
    消息队列通讯
    共享内存通讯
  • 原文地址:https://www.cnblogs.com/hackpig/p/1668566.html
Copyright © 2020-2023  润新知