如果你的时间比较紧,建议直接从第4段开始看
深度优先搜索是一种在开发爬虫早期使用较多的方法。它的目的是要达到被搜索结构的叶结点(即那些不包含任何超链的HTML文件 。在一个HTML文件中,当一个超链被选择后,被链接的HTML文件将执行深度优先搜索,即在搜索其余的超链结果之前必须先完整地搜索单独的一条链。深度优先搜索沿着HTML文件上的超链走到不能再深入为止,然后返回到某一个HTML文件,再继续选择该HTML文件中的其他超链。当不再有其他超链可选择时,说明搜索已经结束。ps:看不懂没关系,毕竟我看不懂。(这段文字摘自百度百科。)
必须要说,搜索不是简简单单看一篇博客就能明白的,需要经验累计才能理解。
搜索分为dfs(深度优先搜索)和bfs(广度优先搜索)两种,而这两种方式可以说差别比较大,所以要分开说。
在学习搜索之前,建议先明白图的定义:https://www.cnblogs.com/chen-1/p/12335809.html
dfs(深搜):
dfs是基于递归的一种搜索,所以它的实现是自己调用自己,一步一步向深处搜索,当出现死路时就“退一步”(专业来讲叫回溯),直到出现一条活路,然后
就沿着这条路一直搜下,直到出现死路再回溯。如此循环往复,直到嵌套的递归条件生效并停止这次深搜。堪称“不撞南墙不回头”啊。
这是一个比较直观的搜索流程
以上就是dfs对一张图的遍历了
现在讲完dfs算法了,接下来可以练几道dfs好题
https://www.luogu.com.cn/problem/P1706 全排列问题
详解:用一个dfs递归函数来枚举,在这道题中,图的深度就是该全排列确定到第几位,每次往“深”dfs就是确定完第x位后枚举第x+1位的数字可以取几,唯
一有所不同的是这道题还要开一个bool数组,记录到目前为止,数i是否被用过,以便枚举
其中idx表示枚举到了第idx位,ans用于记录答案,flag判断这个数是否被用过,而dfs(idx+1)后面那两句ans[i]=0,flag[i]=0是用于回溯,如果第idx为并没有取
数i,则flag与ans都要改变。
void dfs(int idx)//dfs枚举 { if(idx>n)//如果把所有数都用上了,即已经生成一个全排列了 { for(int i=1;i<=n;i++) { printf("%5d",ans[i]); } cout<<endl; //生成成功后直接输出 return; //return必不可少,否则不断枚举下去,会死循环 } for(int i=1;i<=n;i++) { if(flag[i]) continue;//如果该数字被用过,直接跳过即可 flag[i]=1;//标记这个数已经被用过 ans[idx]=i;//记录答案 dfs(idx+1);//往深枚举 flag[i]=0; ans[idx]=0;//回溯 } }
这是一道最简单的dfs了,简直是模板级的。
当然,还有别的较难的题
如https://loj.ac/problem/10018数的划分等等
https://loj.ac/problems/search?keyword=1.3
这里面除了A+B problem以外都是比较有意思的深搜题,建议大家多去刷一刷,十分有助于提高水平!