自用的网页下载器,通过简单修改,改造成通用网页下载器。
功能就是在网址栏里填写入信息网址后,调用自动分析模块或者自定义规则模块,根据网页内容生成信息内容,呈现在软件界面上,进行手工修改后点击保存,即可生成最整洁的网页文件。里面只包含有p、strong等标签,不含其他网页代码,方便拷贝粘贴到其他地方。
此工具软件开发背景:我们有个系统,需要从几个不同网站手工摘选文章,然后把标题、内容等信息录入数据库。该软件开发前,全部是手工操作,粘到后台后,原网页的字体、链接、段落等信息一块带过来了,需要重新进行编辑,费时费力,因此,领导安排开发个自动化工具,把这些需要手工编辑的步骤全部用软件来完成。开发后,编辑维护人员用了几个月,期间不断提出意见建议,经完善,现在逐渐稳定下来,已成日常工作中的标配软件了。该软件是采集软件,与之配套的还有个信息导入软件,是我们系统专用的。
适用人员:需要经常从不同网站采编信息,对采编到的信息格式化要求比较高;采编时候图片需要自动下载到本地,方便拷贝粘贴到其他地方的
使用方法:规则随便做了两三个,自己写的时候,需要有点正则的基础;用的时候,把链接地址拖到地址栏或者拷贝至地方栏都可以,然后等待信息呈现,如无问题,点击保存后,网页就下载至data目录下。生成网页的模板是template.html,本人主要导信息用,因此,模板是随便做的,比较简陋,大家见笑了!
不能上传附件,有点晕!
还是百度网盘吧:http://pan.baidu.com/s/1c1cdvzi