百度空间的文章,被转移到百度云中了,连更新也不行。生怕哪天连云里都不在了,想把内容转出来,结果还没有太好的方法。特别是空间是动态扩展的,想一次把地址抓出来都不容易。最后,不得不自己写了小程序,试验发现,页面动态扩展后,body.all.outerHTML的内容还是初始状态的,但DOM对象中的内容却是最新的。于是,采用遍历所有Tag的方式,把需要的链接抓取下来。
程序及VB源码:
百度空间的文章,被转移到百度云中了,连更新也不行。生怕哪天连云里都不在了,想把内容转出来,结果还没有太好的方法。特别是空间是动态扩展的,想一次把地址抓出来都不容易。最后,不得不自己写了小程序,试验发现,页面动态扩展后,body.all.outerHTML的内容还是初始状态的,但DOM对象中的内容却是最新的。于是,采用遍历所有Tag的方式,把需要的链接抓取下来。
程序及VB源码: