• 使用vba处理网页爬虫


    https://www.sogou.com/link?url=DSOYnZeCC_rR_TP93bdO6GxT14t4sbuOwR4Xg1N-va4KkyI7DJgSnPNx6aHQaobTIeZ8aQ291kY.

     如有侵权,请联系删除

    Sub Main()
    ActiveSheet.Cells.Clear
    Url = "https://www.qppstudio.net/public-holidays-by-date/month1.htm"
    Set oHttp = CreateObject("MSXML2.XMLHTTP") '创建一个xmlhttp对象
    Set odom = CreateObject("htmlfile") '创建一个Dom对象
    With oHttp
    'open,创建一个新的http请求,并指定此请求的方法、URL以及验证信息(用户名/密码) 'send,发送请求到http服务器并接收回应 .Open "GET", Url, False '使用Open方法,用get请求,False代表非异步加载
    .Open "GET", Url, False '使用Open方法,用get请求,False代表非异步加载
    .send '将open方法的信息发送给网页服务器
    odom.body.innerHTML = .responseText '将响应网页的HTML赋值给Dom对象,并只需要body标签里面的内容
    End With
    dom (odom)
    End Sub

    Sub dom(odom As Object)
    i = 2
    For Each Item In odom.all
    If Item.className = "list-item" Then
    For Each itemch In Item.Children
    If itemch.className = "list-item-heading" Then
    Range("a" & i) = itemch.innerText
    ElseIf itemch.className = "list-subitem" Then
    Range("b" & i) = itemch.Children(1).innerText
    Range("c" & i) = itemch.Children(3).innerText
    i = i + 1
    End If
    Next
    Exit For
    End If
    Next
    End Sub

    Sub Main()
    ActiveSheet.Cells.Clear
    Url = "https://www.qppstudio.net/public-holidays-by-date/month1.htm"
    Set oHttp = CreateObject("MSXML2.XMLHTTP") '创建一个xmlhttp对象
    Set odom = CreateObject("htmlfile") '创建一个Dom对象
    With oHttp
    'open,创建一个新的http请求,并指定此请求的方法、URL以及验证信息(用户名/密码) 'send,发送请求到http服务器并接收回应 .Open "GET", Url, False '使用Open方法,用get请求,False代表非异步加载
    .Open "GET", Url, False '使用Open方法,用get请求,False代表非异步加载
    .send '将open方法的信息发送给网页服务器
    odom.body.innerHTML = .responseText '将响应网页的HTML赋值给Dom对象,并只需要body标签里面的内容
    End With
    dom (odom)
    End Sub

    Sub dom(odom As Object)
    i = 2
    For Each Item In odom.all
    If Item.className = "list-item" Then
    For Each itemch In Item.Children
    If itemch.className = "list-item-heading" Then
    Range("a" & i) = itemch.innerText
    ElseIf itemch.className = "list-subitem" Then
    Range("b" & i) = itemch.Children(1).innerText
    Range("c" & i) = itemch.Children(3).innerText
    i = i + 1
    End If
    Next
    Exit For
    End If
    Next
    End Sub

  • 相关阅读:
    sass的安装
    git上传项目到github教程
    v-if 和v-show的区别
    es5实现数组去重
    原生js实现选中所有的checkbox
    拨打手机号
    H5页面打开小程序
    h5 网页 直接唤起淘宝app,并跳转到对应商品页面
    webstorm配置git
    elementUi 日历添加可选区间(只能选择一个月的时间段)
  • 原文地址:https://www.cnblogs.com/lidapengwww/p/12830856.html
Copyright © 2020-2023  润新知