经过几天努力,Nutch终于比较完美的工作了,我有写了一个批处理文件,能够启动Nutch进行Crawl,看着自己搭建的搜索引擎,感觉就是爽
现在有不少做搜索垂直引擎的公司,即使像google,百度也都在做,国内也出现了一些小的公司,如找工作的,搜股票的,搜房的,求医问药的,但感觉做的不是特别好。
比如搜简历,从理论上,你只要在网上留过资料,就可以被搜到,比如我找张三,结果中出现的第一个应该为张三的简历,更有甚者,甚至你发邮件或是其他网络上的操作都可以截获,从google的桌面搜索可以看到.垂直搜索行业性很强,所以不可能被一两个公司垄断,这里面还是很有做头的。