• 软件工程 团队开发(1)


    今天将网页爬虫的功能完成了,并且对于整个功能的框架进行了规划,对时间上的安排,还详细计划进行了分析,一部分的功能还没有实现,所以打算用今天时间对整体的结构进行系统性的规划,目前已经未被完成的开发项目是:网页爬虫图片功能,截图识字功能。基于这两个功能的难易程度,我将开发起来比较简单的网页爬虫功能放到了第一个。截图识字功能能因为环境极其依赖库的问题,至今为止还没有任何可执行的解决方案,这就变成了一个黑洞一般的项目,完全不知道开发完成究竟需要多长的时间,基于这个原则,我决定在完成了除截图识字的功能之后,才把之后所有的时间全部都完成。可是对于图片的爬取依然还是没有完成,把图片爬取作为明天的计划完成。

    问题:依旧是qt4不能支持https导致的对https图片无法爬取的问题。

    明天的计划是对网页爬虫功能的基础上将图片爬虫的功能完成。(https图片无法爬取)

  • 相关阅读:
    (转)C#中Thread.sleep()
    ZigBee无线信道组成
    JSP应用html乱码的终极解决办法
    How to size text using ems
    iframe和frame的区别
    [洛谷P2827]蚯蚓
    [洛谷P3391]【模板】文艺平衡树(Splay)
    [洛谷P4180]严格次小生成树
    HTTP 常见鉴权
    使用 rsync 备份/复制 系统
  • 原文地址:https://www.cnblogs.com/halone/p/10849507.html
Copyright © 2020-2023  润新知