这种方法主要使用火车头采集工具来进行的。
准备:
火车头软件:LocoySpider_V8.6_Build20150323.rar(官方下载)
网站:http://xh.5156edu.com/
安装:安装火车头软件( 默认安装)
设置采集任务
1.分组任务树中添加自定义分组和任务:
2.在任务zidian3中进行设置(设置选项顺序排列)
3.设置和编译任务的网址:
4.设置采集网址规则:
5.测试采集网址:
6.测试该页面并进行编辑:
7.编辑采集字段:
8.开始采集并查看采集结果
9.数据采集完毕,保存到sqlite数据库里面
到了数据库里面之后就可以进行任意编辑和整理了。
*注:采集是智能的,但是也有不完美的地方,不对的地方需要手动修改。这里用到SQL语句不懂的地方可以去网上查查。
最后:感谢均均的大力支持和帮助