按照老师的要求爬出石家庄铁道大学百度贴吧,对代码进行解析,今天实现了代码的功能,明天对代码进行优化爬取更多。
这里就是对于网页的解析,但是以前做的只是对于数据的读取,还没有做到解析,因此还要学习下html的解析,不过也实现了对于内容的爬取。