今天将网页爬虫的功能完成了,并且对于整个功能的框架进行了规划,对时间上的安排,还详细计划进行了分析,一部分的功能还没有实现,所以打算用今天时间对整体的结构进行系统性的规划,目前已经未被完成的开发项目是:网页爬虫图片功能,截图识字功能。基于这两个功能的难易程度,我将开发起来比较简单的网页爬虫功能放到了第一个。截图识字功能能因为环境极其依赖库的问题,至今为止还没有任何可执行的解决方案,这就变成了一个黑洞一般的项目,完全不知道开发完成究竟需要多长的时间,基于这个原则,我决定在完成了除截图识字的功能之后,才把之后所有的时间全部都完成。可是对于图片的爬取依然还是没有完成,把图片爬取作为明天的计划完成。
问题:依旧是qt4不能支持https导致的对https图片无法爬取的问题。
明天的计划是对网页爬虫功能的基础上将图片爬虫的功能完成。(https图片无法爬取)