1.代码规范参考书:《高质量C++编程指南》
链接为:https://www.cnblogs.com/bytebee/p/8204933.html
2.吴军博士的《数学之美》,让我们体验到数学的博大精深。因为对网络爬虫挺感兴趣的,所有阅读了数学之美系列六-图论和网络爬虫的相关内容。从“七桥问题”引申出“图论”,再联系上网络爬虫的实现原理。大一学习了离散数学,只是了解了一些数理知识,但还是不太清楚其中与计算机程序设计有什么特殊联系,但在吴军博士的《数学之美》中get到了。
作者通过我们国家各个地区的连通及经过做为一个实例,讲述了算法中的“深度优先遍历”和“广度优先遍历”(即数据结构中两种基础且重要的图遍历算法)。网络爬虫也是差不多原理,以一个超链接作为节点,下载该超链接下的网页,接着继续访问附着在该页面下的其他超链接以及下载。在访问的同时也要记录已访问的超链接,避免重复访问,这里又使用到数据结构中提到的哈希表。
根据网上关于算法在软件开发的作用的文章,可以得出:我们可以把实现网络爬虫比喻成我们目前需要解决的困难,而算法中的“深度优先遍历”和“广度优先遍历”就是解决这个难题的方法。也就是说算法的好坏直接决定了解决网络爬虫的效率。所以说好的算法能有效加快软件的开发进程。
3.目前还没有确定要用算法实现一个什么样的软件。