• Delphi TWebBrowser[5] 获取含框架的网页完整html源码 及多个框架(跨域)的方法


    Delphi TWebBrowser[5] 获取含框架的网页完整html源码 及多个框架(跨域)的方法

    1、获取html源码的常规方法:

    (WebBrowser1.Document as IHtmlDocument2).body.outerHtml;
    

    2、获取含框架frame的完整html源码(<body>之外如<head>) 

    var
      ole_index, oleObj: OleVariant;
      i: integer;
    begin
    //  if WebBrowser1.Busy then  Exit; //网页加载中,退出。
      with Memo1.Lines do begin   //获取主框架网址及网页源码
        Clear;
        Add(WebBrowser1.OleObject.document.url);
        Add(WebBrowser1.OleObject.document.documentElement.outerHTML);
        Add(' ');  Add(' '); //添加空行
      end;
    //循环获取每一个子框架网址及网页源码
      for i := 0 to WebBrowser1.OleObject.document.frames.length - 1 do
      begin
        ole_index := i;
        oleObj := WebBrowser1.OleObject.document.frames.item(ole_index);
        with Memo1.Lines do begin
          Add(oleObj.document.url);
          Add(oleObj.document.documentElement.outerHtml);
          Add(' ');  Add(' '); //添加空行
        end;
      end;
    end;  

    3、多个框架(跨域)

    Uses MsHtml, ActiveX

    var i: Integer; ole_index: OleVariant; FrameDis: IDispatch; FrameWin: IHtmlWindow2; psi:IServiceProvider; frameb: IWebBrowser2; pPersist: IPersistStreamInit; ss: TStringStream; str1, str2: String; begin if WebBrowser1.Busy then Exit; Memo1.Lines.Clear; //获取主网页网址 Memo1.Lines.Add(WebBrowser1.OleObject.document.url); //获取主网页源码 Memo1.Lines.Add(WebBrowser1.OleObject.document.documentElement.outerHTML); //添加空行 Memo1.Lines.Add(' '); for i := 0 to WebBrowser1.OleObject.document.frames.length - 1 do begin ole_index := i; FrameDis := (WebBrowser1.Document as IHtmlDocument2).frames.item(ole_index); FrameDis.QueryInterface(IID_IHTMLWindow2, FrameWin) ; if FrameWin = nil then Continue; FrameWin.QueryInterface(IServiceProvider, psi); if psi = nil then Continue; psi.QueryService(IID_IWebBrowserApp,IID_IWebBrowser2,frameb); if frameb=nil then continue; frameb.Document.QueryInterface(IPersistStreamInit, pPersist); if pPersist = nil then Continue; //获取框架页网址 Memo1.Lines.Add((frameb.Document as IHtmlDocument2).url); ss := TStringStream.Create(''); try //获取框架页源码 if Succeeded(pPersist.Save(TStreamAdapter.Create(ss), True)) then begin str1 := ss.DataString; str2 := Utf8ToAnsi(str1); //有些网页使用UTF-8编码方式,不进行转换中文会乱码 if str2 = '' then Memo1.Lines.Add(str1) else Memo1.Lines.Add(str2); end; finally FreeAndNil(ss); end; Memo1.Lines.Add(' '); //添加空行 end; end;

      

      

    创建时间:2020.11.23  更新时间:

    博客园 滔Roy https://www.cnblogs.com/guorongtao 希望内容对你所有帮助,谢谢!
  • 相关阅读:
    iOS
    UI基本视图控制
    堆和栈的区别 ?
    单例模式
    Object-c的类可以多重继承么?可以实现多个接口么?Category是什么?重写一个类的方式用继承好还是分类好?为什么?
    id
    协议
    分类(类别)
    #import和#include以及@class三者的区别?
    内存管理
  • 原文地址:https://www.cnblogs.com/guorongtao/p/14022728.html
Copyright © 2020-2023  润新知