1、爬取
搜索引擎蜘蛛(spider)通过链接访问网页,然后把抓取网页的内容存取到数据库中。
2、预处理
搜索引擎对抓取到的网页进行,索引,分词,内容处理,链接关系计算等处理。
3、排名
最后根据用户搜索的关键词,调用索引库的内容,计算相关性,生成相关页。